REDSearcher 深度搜索 Agent 的工作流与示意图

2026年3月8日

73

842

REDSearcher: A Scalable and Cost-Efficient Framework for Long-Horizon Search Agents

REDSearcher 团队提出了一套面向长程搜索任务的低成本可扩展训练框架,旨在解决数据稀缺、能力鸿沟与环境缺失三大瓶颈,使复杂搜索问题能被高效自动化合成并训练出具备深度搜索能力的模型。

框架核心思想与设计

该框架引入图论中的 TreeWidth 概念来定义任务复杂度,通过自动化合成高难度任务样本,并结合两阶段训练与 SFTAgenticRL 策略,实现在有限数据与成本下训练出强大的搜索 Agent。

性能与实验结果

在一系列长程问答与深度搜索基准上,REDSearcher 的 30B 参数模型取得了开源模型的 SOTA 表现,并在若干基准上超越了闭源模型,展示了其在成本可控前提下的竞争力。

采用 TreeWidth 定义任务复杂度并自动合成高难度任务,使低成本训练下仍能获得强大的长程搜索能力。

“小墨”

系统实现与可扩展性

项目设计注重可复现性与工程可扩展性,支持在本地模拟搜索过程以便快速迭代算法,同时兼容多模态任务扩展,降低了大规模标注与环境交付的门槛。

应用前景与挑战

REDSearcher 为长程推理与复杂搜索场景提供了可行路线,未来需在更多真实世界任务中验证泛化性,并持续优化合成任务质量与训练成本。此外,社区协作与安全测试也是后续工作的重点。

如有侵权,请联系删除。

Related Articles

联系我们 预约演示
小墨 AI