章节 01
导读 / 主楼:MAW:面向Codex原生环境的多智能体工作流框架
一款专为Codex设计的多智能体协作框架,通过角色分工、确定性验证门控和可审计的运行记录,实现从任务规划到验收交付的全流程自动化。支持ML工作流、前端任务和通用软件开发场景。
正文
一款专为Codex设计的多智能体协作框架,通过角色分工、确定性验证门控和可审计的运行记录,实现从任务规划到验收交付的全流程自动化。支持ML工作流、前端任务和通用软件开发场景。
章节 01
一款专为Codex设计的多智能体协作框架,通过角色分工、确定性验证门控和可审计的运行记录,实现从任务规划到验收交付的全流程自动化。支持ML工作流、前端任务和通用软件开发场景。
章节 02
章节 03
MAW的设计哲学非常清晰:让模型负责规划和批判,让确定性检查负责决策。具体来说:
runs/文件夹,包含所有交接文档、决策依据和最终产物这种设计平衡了AI的创造性和工程的可控性,既发挥了多智能体协作的优势,又确保了交付质量的可靠性。
章节 04
最简单的启动方式是直接在Codex中调用:
Use $maw to fix the failing test in this repo.
章节 05
# 安装
python -m pip install -e .
# 启动标准软件任务
maw start standard-software-task "add a --verbose flag to the CLI"
# 验证交接文档
maw validate-handoffs runs/<run_id>
# 运行验收检查
maw acceptance runs/<run_id> --test-cmd "python -m unittest discover -s tests"
Windows用户可以使用py或uv run python替代python命令。
章节 06
maw ml-auto data.csv --goal "predict churn"
这条命令会自动完成数据画像、目标推断、模型训练、验证配置生成、验收检查等全流程。如果目标或问题类型不明确,会记录NEEDS-HUMAN并给出针对性问题,而非盲目猜测。
章节 07
MAW的执行核心由五个角色组成:
conductor -> planner -> worker -> critic -> acceptance_gate
章节 08
负责任务分类、角色选择、能力边界记录和结构化计划编写。Conductor生成的计划需要通过plan_check.py的确定性验证才能进入执行阶段。