正文

SearchSwarm：为长程深度研究赋予智能体委派能力

SearchSwarm通过 harness 引导的训练方法，将委派智能内化为模型能力，使30B参数模型在BrowseComp基准上达到68.1分，为长程深度研究任务中的智能体协作提供了开源解决方案。

智能体委派智能长程任务BrowseComp任务分解多智能体系统深度研究

发布时间 2026/06/09 00:52最近活动 2026/06/09 12:50预计阅读 1 分钟

章节 01

SearchSwarm导读：赋予智能体委派能力，突破长程深度研究上下文限制

本文介绍SearchSwarm——一种针对长程深度研究任务的智能体解决方案。它通过harness引导的训练方法，将委派智能内化为模型能力，使30B参数模型在BrowseComp基准上取得68.1分，并开源harness、模型权重及训练数据，助力多智能体系统发展。

章节 02

大型语言模型上下文窗口有限，而长程深度研究任务需处理大量搜索、信息整合与跨文档推理，超出单一模型容量。解决此矛盾需委派智能：主代理分解子任务给子代理，子代理返回摘要节省上下文。委派智能包含任务分解、委派决策、结果整合三个核心能力，但自然文本中缺乏显式委派记录，导致训练数据稀缺。

章节 03

SearchSwarm设计harness约束框架，引导主代理合理分解子任务、子代理按格式返回结果。利用harness生成的轨迹作为监督微调数据，将委派智能内化为模型权重。该方法无需昂贵真人标注，可规模化生成高质量训练数据。

章节 04

SearchSwarm-30B-A3B模型在BrowseComp基准获68.1分，BrowseComp-ZH获73.3分，均为同等规模模型最佳。成绩由仅300亿激活参数（A3B）的模型实现，展现高效架构潜力。

章节 05

研究团队开源harness、模型权重和训练数据，为社区研究委派智能提供基础。对开发者，SearchSwarm提供可复现路线：通过约束框架生成训练数据，将复杂能力内化为模型本身，简化架构并提升端到端效率与可靠性。