正文

从早期经验中学习智能体路由：BoundaryRouter的高效查询分配策略

本文提出BoundaryRouter框架，通过利用早期行为经验和评分标准引导的推理，在冷启动场景下实现LLM推理与完整智能体执行之间的高效路由，实验显示可减少60.6%推理时间同时提升28.6%性能。

智能体路由冷启动查询分配成本优化经验学习LLM智能体

发布时间 2026/05/08 11:18最近活动 2026/05/11 12:23预计阅读 2 分钟

章节 01

【主楼/导读】BoundaryRouter：冷启动场景下智能体路由的高效策略

本文提出BoundaryRouter框架，通过利用早期行为经验和评分标准引导的推理，解决冷启动场景下LLM推理与完整智能体执行之间的高效路由问题。实验显示该策略可减少60.6%推理时间，同时提升28.6%性能。

章节 02

大语言模型智能体在复杂推理任务能力强，但延迟和计算成本高；许多查询无需完整智能体执行，资源需求不匹配催生智能路由需求。冷启动场景缺乏历史数据，传统监督学习方法难以应用，要求路由方案无需训练、快速部署且能逐步优化。

章节 03

BoundaryRouter核心创新是"从早期经验中学习"：构建紧凑经验记忆库，通过共享种子集同时执行轻量级LLM和完整智能体获取初始对比经验；推理阶段检索相似历史案例指导路由决策，结合评分标准引导推理，透明可解释，适合冷启动场景。

章节 04

研究团队构建RouteBench基准测试，覆盖域内、改写、域外三种关键场景，确保评估结果反映方法在不同分布偏移下的鲁棒性，为智能体路由研究提供标准化评估平台。

章节 05

BoundaryRouter相比始终用智能体基线减少60.6%推理时间，相比直接LLM推理提升28.6%性能；对比基于提示的路由提升37.9%，对比仅检索路由提升8.2%，证明其结合经验学习与评分引导的优势。

章节 06

BoundaryRouter方法论具广泛借鉴意义：小数据启动、持续优化范式适用于多AI部署场景；为开发者提供可行方案，无需大量历史数据快速上线，随使用逐步改进，符合现实部署需求。

章节 07

当前局限：经验记忆库容量和检索效率在大规模场景可能成瓶颈，相似性度量非最优。未来方向：探索高效记忆结构、精准相似性计算，动态更新记忆库适应分布漂移，扩展至多智能体场景。