Zing 论坛

正文

AgentSlimming:多智能体系统的"瘦身"之道,token成本降低78.9%

AgentSlimming框架通过混合机制评估智能体重要性,移除冗余或替换为低成本智能体,在保持性能的同时将多智能体系统的token成本降低78.9%。

多智能体系统模型压缩成本优化token效率智能体剪枝MAS
发布时间 2026/05/09 17:03最近活动 2026/05/12 13:26预计阅读 2 分钟
AgentSlimming:多智能体系统的"瘦身"之道,token成本降低78.9%
1

章节 01

导读:AgentSlimming——多智能体系统的高效瘦身方案

基于大型语言模型的多智能体系统(MAS)在复杂任务中表现出色,但智能体数量膨胀导致token消耗过高。AgentSlimming框架通过混合机制评估智能体重要性,移除冗余或替换为低成本智能体,在保持性能的同时将token成本降低78.9%,为多智能体系统效率优化提供实用方案。

2

章节 02

背景:多智能体系统为何会'发胖'?

多智能体系统'发胖'的根源包括:

  1. 手动设计局限:依赖经验,易添加冗余'保险'智能体;
  2. 自动化扩展副作用:缺乏修剪机制,智能体添加后难移除;
  3. 冗余级联效应:不必要的智能体不仅自身消耗资源,还放大交互开销。
3

章节 03

方法:AgentSlimming的三层压缩机制

AgentSlimming借鉴神经网络压缩的剪枝和量化思想,核心为三层压缩机制:

  1. 混合重要性评估:从结构(通信图位置)、功能(任务贡献)、交互(信息流动关键度)多维度评估智能体价值;
  2. 双模式压缩:移除低重要性智能体,或替换高成本智能体为低成本替代方案;
  3. 基线锚定接受规则:压缩后验证性能,若下降超阈值则回滚,确保安全瘦身。
4

章节 04

证据:78.9%成本削减的实验结果

实验结果显示:

  • Token成本降低:平均78.9%,最高超90%;
  • 性能保持:下降可忽略,部分任务性能提升;
  • 性能提升原因:移除冗余减少信息噪声、简化协调决策、资源聚焦核心智能体。
5

章节 05

应用价值:开发者、企业与研究人员的获益

AgentSlimming的应用价值:

  • 开发者:降低实验成本、简化系统设计、保障性能;
  • 企业用户:减少API费用、提升响应速度、易维护;
  • 研究人员:理解智能体贡献、指导系统设计、开源协作。
6

章节 06

局限与未来方向:静态到动态的探索

当前局限:

  1. 静态压缩:针对静态工作流,动态系统压缩待解决;
  2. 任务依赖性:效果因任务而异;
  3. 替代方案限制:依赖低成本智能体替代选项。 未来方向:动态压缩、自适应阈值、跨任务迁移、多目标优化。
7

章节 07

开源与社区:推动多智能体系统生态建设

AgentSlimming代码已开源至GitHub,意义包括:

  • 可复现性:便于验证扩展实验;
  • 社区贡献:支持新压缩策略开发;
  • 生态建设:推动多智能体系统工具标准化。
8

章节 08

结语:AI系统设计中'做减法'的价值

AgentSlimming实现了多智能体系统的高效瘦身,核心启示:AI系统设计中'做减法'比'做加法'更难但更有价值。它为多智能体系统从臃肿到精简、昂贵到高效的转变提供了可行路径,是技术进步与设计哲学的升华。