Zing 论坛

正文

Mimosa:面向科学研究的进化型多智能体系统框架

Mimosa框架通过动态工具发现、元编排器生成工作流拓扑、代码生成智能体执行子任务,实现科学研究的自动化多智能体协作,在ScienceAgentBench上达到43.1%成功率。

多智能体系统自主科学研究智能体框架工作流进化科学自动化MCP协议开源平台
发布时间 2026/03/31 04:35最近活动 2026/04/01 09:19预计阅读 2 分钟
Mimosa:面向科学研究的进化型多智能体系统框架
1

章节 01

【导读】Mimosa:进化型多智能体系统框架助力自主科学研究

Mimosa是面向科学研究的进化型多智能体系统框架,通过动态工具发现、元编排器生成工作流拓扑、代码生成智能体执行子任务实现自动化协作,解决当前自主科学研究系统依赖固定工作流和工具集的局限,在ScienceAgentBench上达到43.1%成功率。其核心设计理念为自主进化,具备模块化、可审计性和开放性特点。

2

章节 02

背景:自主科学研究的现状与挑战

自主科学研究(ASR)是AI在科研领域的前沿方向,LLM和智能体架构推动其发展,但多数ASR系统依赖预定义固定工作流和工具集,难以应对科研的动态变化(如新方法涌现、任务演化),遇到新任务或需整合新工具时需人工重新配置。

3

章节 03

Mimosa框架的设计理念

Mimosa针对ASR局限提出,核心理念是让系统根据任务需求自动合成多智能体工作流并通过反馈迭代优化。关键原则包括:模块化与可扩展性(工具无关设计)、可审计性(完整记录执行轨迹与版本历史)、开放性(完全开源)。

4

章节 04

核心架构:四大组件协同工作

Mimosa架构含四大组件:

  1. 动态工具发现层:基于MCP协议,运行时动态识别新工具,增强适应性;
  2. 元编排器:针对任务生成定制化工作流拓扑,定义智能体角色、数据流向与任务分解;
  3. 代码生成智能体:执行子任务,调用工具或生成代码操作科学库与资源;
  4. LLM评判器与反馈循环:对执行结果评分并生成反馈,驱动工作流迭代优化。
5

章节 05

实验评估:超越基线的性能表现

在ScienceAgentBench基准测试中,Mimosa使用DeepSeek-V3.2模型达到43.1%成功率,超越单智能体(缺乏协作)和静态多智能体(固定工作流)基线。不同模型对多智能体分解和迭代学习响应差异显著,提示系统设计需考虑模型特性匹配。

6

章节 06

可审计性与科学可重复性

Mimosa完整记录执行轨迹(工作流结构、智能体输入输出、工具调用、代码结果等),归档工作流版本历史,支持事后审查、错误分析与科学复现,便于领域专家在关键环节指导修正。

7

章节 07

应用前景与社区价值

Mimosa模块化与工具无关设计使其通用,可处理生物信息学、材料模拟等跨学科科研任务。作为开源平台,为ASR领域提供开放基础设施,支持社区开发新工具、改进算法,加速自主科学研究从概念走向应用。