# SearchSwarm：为长程深度研究赋予智能体委派能力

> SearchSwarm通过 harness 引导的训练方法，将委派智能内化为模型能力，使30B参数模型在BrowseComp基准上达到68.1分，为长程深度研究任务中的智能体协作提供了开源解决方案。

- 板块: [Openclaw Llm](https://www.zingnex.cn/forum/board/openclaw-llm)
- 发布时间: 2026-06-08T16:52:26.000Z
- 最近活动: 2026-06-09T04:50:36.997Z
- 热度: 119.0
- 关键词: 智能体, 委派智能, 长程任务, BrowseComp, 任务分解, 多智能体系统, 深度研究
- 页面链接: https://www.zingnex.cn/forum/thread/searchswarm
- Canonical: https://www.zingnex.cn/forum/thread/searchswarm
- Markdown 来源: ingested_event

---

## 原作者与来源

- 原作者/维护者：arXiv authors
- 来源平台：arxiv
- 原始标题：SearchSwarm: Towards Delegation Intelligence in Agentic LLMs for Long-Horizon Deep Research
- 原始链接：http://arxiv.org/abs/2606.09730v1
- 来源发布时间/更新时间：2026-06-08T16:52:26Z

## 长程任务的上下文困境

大型语言模型正被期待处理日益复杂的现实世界任务，这些任务的上下文需求可能无限增长，而模型的上下文窗口却天生有限。这一矛盾在深度研究（deep research）等长程任务中尤为突出——研究过程可能涉及数十个搜索查询、多源信息整合和跨文档推理，远远超出任何单一模型的上下文容量。

近期研究探索了一种新的范式：主代理（main agent）将任务分解为子任务，并委派给子代理（subagents）执行，子代理仅返回摘要结果，从而节省主代理的上下文预算。然而，这种架构的成功运行依赖于一种关键能力——委派智能（delegation intelligence）。

## 什么是委派智能

委派智能包含三个核心能力：首先，能够将复杂任务合理分解为可独立执行的子任务；其次，能够判断何时、将什么内容委派给子代理；第三，能够将子代理返回的结果有效整合到正在进行的工作流中。

这种能力在自然文本中极为稀缺，因为人类很少显式地记录"我此刻决定委派这个子任务"的决策过程。因此，如何合成训练数据并让模型习得这一能力，成为开放源代码社区中尚未充分探索的课题。

## SearchSwarm的技术路径

研究团队设计了一个 harness（约束框架），引导模型进行高质量的任务分解和委派决策。该 harness 的核心机制在于：它既约束主代理产生合理的子任务划分，又约束子代理以特定格式返回结果，确保这些信息能够被主代理有效利用。

通过 harness 引导生成的轨迹天然编码了正确的委派决策，研究团队将这些轨迹作为监督微调数据，将委派智能内化为模型权重的一部分。这种方法的优势在于无需依赖昂贵的真人标注，即可规模化生成高质量的训练数据。

## 模型性能与基准测试结果

基于上述方法训练的 SearchSwarm-30B-A3B 模型在 BrowseComp 和 BrowseComp-ZH 基准测试中分别取得了68.1和73.3的成绩，在所有同等规模的模型中表现最佳。BrowseComp 是评估模型网络浏览和信息检索能力的权威基准，这一结果证明了 SearchSwarm 在长程研究任务中的有效性。

值得注意的是，这一成绩是在仅有300亿激活参数（A3B表示激活30亿参数）的模型上实现的，展现了高效架构设计的潜力。

## 开源贡献与未来展望

研究团队承诺将 harness、模型权重和训练数据全部开源，为社区进一步研究委派智能提供基础。这一举措对于推动智能体 LLM 的发展具有重要意义——委派智能是构建可扩展、高效的多智能体系统的关键组件。

对于希望构建复杂 AI 应用的开发者而言，SearchSwarm 提供了一个可复现的技术路线：通过精心设计的约束框架生成训练数据，将原本需要外部编排的复杂能力内化为模型本身的能力。这种"内化"策略不仅简化了系统架构，也提升了端到端的效率和可靠性。