Zing 论坛

正文

EvoMAS:多智能体系统的执行时工作流学习框架

EvoMAS通过Planner-Evaluator-Updater管道动态构建任务状态,并使用学习的工作流适配器实例化阶段特定的分层工作流,解决了长程任务中静态多智能体协调策略的局限性。

多智能体系统动态工作流执行时学习智能体协调长程任务策略梯度
发布时间 2026/05/09 15:55最近活动 2026/05/12 11:21预计阅读 2 分钟
EvoMAS:多智能体系统的执行时工作流学习框架
1

章节 01

EvoMAS框架导读:动态工作流学习解决多智能体长程任务协调问题

EvoMAS是针对多智能体系统静态协调策略局限性的执行时工作流学习框架,核心通过Planner-Evaluator-Updater管道构建动态任务状态,并利用学习的工作流适配器实例化阶段特定分层工作流,以应对长程任务中子目标、中间证据和信息需求的演变。

2

章节 02

多智能体系统的静态协调困境

基于大语言模型的多智能体系统在复杂任务中潜力显著,但多数方法采用一次性范式:执行前优化/选择工作流,全程固定使用。这种静态策略对长程任务不足,因其子目标、中间证据和信息需求会随执行阶段演变。

3

章节 03

EvoMAS框架核心设计

EvoMAS将工作流构建化为元级序列决策问题,核心创新包括:1. Planner-Evaluator-Updater管道:Planner分析当前状态规划行动,Evaluator评估候选智能体适用性,Updater根据反馈更新状态;2. 学习式工作流适配器:从候选池实例化阶段特定分层工作流,动态调整智能体组合与策略;3. 训练机制:适配器用策略梯度训练,以终端任务成功为监督信号,分析过程奖励在极稀疏奖励下的作用。

4

章节 04

实验验证与结果

在GAIA、HLE、DeepResearcher等基准评估显示:EvoMAS优于单智能体基线及近期自动化多智能体工作流设计方法;显式任务状态构建与学习工作流适配具互补优势;终端成功极稀疏时过程奖励最有用。定性案例表明系统能识别阶段转换节点、调整智能体分工、根据新信息重配工作流。

5

章节 05

EvoMAS的技术贡献与意义

EvoMAS实现多智能体系统从静态设计到动态适应的转变,核心贡献:1. 执行时工作流构建,突破预定义限制;2. 显式状态建模,支持更智能决策;3. 端到端学习,从稀疏奖励中学习复杂协调策略。

6

章节 06

EvoMAS的应用前景与展望

EvoMAS适用于开放域研究任务(多轮信息收集推理)、复杂问题求解(子目标随探索细化)、动态环境交互(外部变化需策略调整)。该框架为灵活强大的多智能体系统提供新范式,推动自主AI代理实际部署。