章节 01
UnityMAS-O框架导读:用强化学习统一优化LLM多智能体系统
现有LLM多智能体系统依赖手工编排,缺乏统一优化接口。UnityMAS-O是一个通用的强化学习优化框架,将完整工作流作为优化单元,支持角色级信用分配和参数共享策略,在问答、搜索、代码生成任务上验证有效。来源:arXiv 2026年5月论文《UnityMAS-O: A General RL Optimization Framework for LLM-Based Multi-Agent Systems》(链接:http://arxiv.org/abs/2605.26646v1)