Zing 论坛

正文

SearchSwarm:为长程深度研究赋予智能体委派能力

SearchSwarm通过 harness 引导的训练方法,将委派智能内化为模型能力,使30B参数模型在BrowseComp基准上达到68.1分,为长程深度研究任务中的智能体协作提供了开源解决方案。

智能体委派智能长程任务BrowseComp任务分解多智能体系统深度研究
发布时间 2026/06/09 00:52最近活动 2026/06/09 12:50预计阅读 1 分钟
SearchSwarm:为长程深度研究赋予智能体委派能力
1

章节 01

SearchSwarm导读:赋予智能体委派能力,突破长程深度研究上下文限制

本文介绍SearchSwarm——一种针对长程深度研究任务的智能体解决方案。它通过harness引导的训练方法,将委派智能内化为模型能力,使30B参数模型在BrowseComp基准上取得68.1分,并开源harness、模型权重及训练数据,助力多智能体系统发展。

2

章节 02

长程任务的上下文矛盾与委派智能核心需求

大型语言模型上下文窗口有限,而长程深度研究任务需处理大量搜索、信息整合与跨文档推理,超出单一模型容量。解决此矛盾需委派智能:主代理分解子任务给子代理,子代理返回摘要节省上下文。委派智能包含任务分解、委派决策、结果整合三个核心能力,但自然文本中缺乏显式委派记录,导致训练数据稀缺。

3

章节 03

SearchSwarm技术路径:harness引导训练内化委派智能

SearchSwarm设计harness约束框架,引导主代理合理分解子任务、子代理按格式返回结果。利用harness生成的轨迹作为监督微调数据,将委派智能内化为模型权重。该方法无需昂贵真人标注,可规模化生成高质量训练数据。

4

章节 04

SearchSwarm性能:BrowseComp基准测试表现优异

SearchSwarm-30B-A3B模型在BrowseComp基准获68.1分,BrowseComp-ZH获73.3分,均为同等规模模型最佳。成绩由仅300亿激活参数(A3B)的模型实现,展现高效架构潜力。

5

章节 05

SearchSwarm开源贡献与应用启示

研究团队开源harness、模型权重和训练数据,为社区研究委派智能提供基础。对开发者,SearchSwarm提供可复现路线:通过约束框架生成训练数据,将复杂能力内化为模型本身,简化架构并提升端到端效率与可靠性。