Zing 论坛

正文

MAW:面向Codex原生环境的多智能体工作流框架

一款专为Codex设计的多智能体协作框架,通过角色分工、确定性验证门控和可审计的运行记录,实现从任务规划到验收交付的全流程自动化。支持ML工作流、前端任务和通用软件开发场景。

多智能体工作流框架CodexAI编程自动化ML工程代码审查确定性检查任务编排智能体协作
发布时间 2026/06/03 11:44最近活动 2026/06/03 11:51预计阅读 2 分钟
MAW:面向Codex原生环境的多智能体工作流框架
1

章节 01

导读 / 主楼:MAW:面向Codex原生环境的多智能体工作流框架

一款专为Codex设计的多智能体协作框架,通过角色分工、确定性验证门控和可审计的运行记录,实现从任务规划到验收交付的全流程自动化。支持ML工作流、前端任务和通用软件开发场景。

3

章节 03

核心设计理念

MAW的设计哲学非常清晰:让模型负责规划和批判,让确定性检查负责决策。具体来说:

  • 模型判断用于规划:智能体可以基于模型能力进行任务分解、方案设计和代码生成
  • 记录证据用于决策:关键的通过/不通过决策必须依赖已记录的证据和标准库检查,而非模型的主观判断
  • 可审计的运行记录:每个运行都有完整的runs/文件夹,包含所有交接文档、决策依据和最终产物

这种设计平衡了AI的创造性和工程的可控性,既发挥了多智能体协作的优势,又确保了交付质量的可靠性。

4

章节 04

从Codex使用

最简单的启动方式是直接在Codex中调用:

Use $maw to fix the failing test in this repo.
5

章节 05

本地CLI使用

# 安装
python -m pip install -e .

# 启动标准软件任务
maw start standard-software-task "add a --verbose flag to the CLI"

# 验证交接文档
maw validate-handoffs runs/<run_id>

# 运行验收检查
maw acceptance runs/<run_id> --test-cmd "python -m unittest discover -s tests"

Windows用户可以使用pyuv run python替代python命令。

6

章节 06

机器学习任务一键启动

maw ml-auto data.csv --goal "predict churn"

这条命令会自动完成数据画像、目标推断、模型训练、验证配置生成、验收检查等全流程。如果目标或问题类型不明确,会记录NEEDS-HUMAN并给出针对性问题,而非盲目猜测。

7

章节 07

运行循环与角色体系

MAW的执行核心由五个角色组成:

conductor -> planner -> worker -> critic -> acceptance_gate
8

章节 08

Conductor(指挥者)

负责任务分类、角色选择、能力边界记录和结构化计划编写。Conductor生成的计划需要通过plan_check.py的确定性验证才能进入执行阶段。