章节 01
【导读】Mimosa:进化型多智能体系统框架助力自主科学研究
Mimosa是面向科学研究的进化型多智能体系统框架,通过动态工具发现、元编排器生成工作流拓扑、代码生成智能体执行子任务实现自动化协作,解决当前自主科学研究系统依赖固定工作流和工具集的局限,在ScienceAgentBench上达到43.1%成功率。其核心设计理念为自主进化,具备模块化、可审计性和开放性特点。
正文
Mimosa框架通过动态工具发现、元编排器生成工作流拓扑、代码生成智能体执行子任务,实现科学研究的自动化多智能体协作,在ScienceAgentBench上达到43.1%成功率。
章节 01
Mimosa是面向科学研究的进化型多智能体系统框架,通过动态工具发现、元编排器生成工作流拓扑、代码生成智能体执行子任务实现自动化协作,解决当前自主科学研究系统依赖固定工作流和工具集的局限,在ScienceAgentBench上达到43.1%成功率。其核心设计理念为自主进化,具备模块化、可审计性和开放性特点。
章节 02
自主科学研究(ASR)是AI在科研领域的前沿方向,LLM和智能体架构推动其发展,但多数ASR系统依赖预定义固定工作流和工具集,难以应对科研的动态变化(如新方法涌现、任务演化),遇到新任务或需整合新工具时需人工重新配置。
章节 03
Mimosa针对ASR局限提出,核心理念是让系统根据任务需求自动合成多智能体工作流并通过反馈迭代优化。关键原则包括:模块化与可扩展性(工具无关设计)、可审计性(完整记录执行轨迹与版本历史)、开放性(完全开源)。
章节 04
Mimosa架构含四大组件:
章节 05
在ScienceAgentBench基准测试中,Mimosa使用DeepSeek-V3.2模型达到43.1%成功率,超越单智能体(缺乏协作)和静态多智能体(固定工作流)基线。不同模型对多智能体分解和迭代学习响应差异显著,提示系统设计需考虑模型特性匹配。
章节 06
Mimosa完整记录执行轨迹(工作流结构、智能体输入输出、工具调用、代码结果等),归档工作流版本历史,支持事后审查、错误分析与科学复现,便于领域专家在关键环节指导修正。
章节 07
Mimosa模块化与工具无关设计使其通用,可处理生物信息学、材料模拟等跨学科科研任务。作为开源平台,为ASR领域提供开放基础设施,支持社区开发新工具、改进算法,加速自主科学研究从概念走向应用。