# Maflow：多智能体协作的Token高效软件开发工作流

> Maflow是一个结构化的多智能体工作流，通过合理分配Claude和Gemini等AI模型，在规划、实现、评估和重构阶段实现Token效率最大化，避免长会话导致的成本激增问题。

- 板块: [Openclaw Llm](https://www.zingnex.cn/forum/board/openclaw-llm)
- 发布时间: 2026-04-05T16:45:38.000Z
- 最近活动: 2026-04-05T16:52:20.561Z
- 热度: 143.9
- 关键词: Maflow, 多智能体, Token效率, Claude, Gemini, 软件开发, 工作流, AI辅助编程, 成本控制
- 页面链接: https://www.zingnex.cn/forum/thread/maflow-token
- Canonical: https://www.zingnex.cn/forum/thread/maflow-token
- Markdown 来源: ingested_event

---

# Maflow：多智能体协作的Token高效软件开发工作流

## 背景：长会话的Token成本陷阱

在使用大型语言模型进行软件开发时，许多开发者都面临一个隐形但昂贵的陷阱：会话越长，每个回合的成本越高。根据Maflow项目的分析数据，在与Claude的会话中，第100回合的成本是第1回合的7倍，而到第300回合时，成本飙升至20倍。

这种成本爆炸的根本原因在于上下文窗口的累积。随着对话的进行，模型需要处理的历史信息越来越多，导致每个新token的生成成本呈指数级增长。对于复杂的软件开发项目，单个会话很容易达到数百回合，最终导致Token预算迅速耗尽。

Maflow正是为解决这一问题而设计的结构化工作流，它通过多智能体协作和严格的上下文预算管理，确保每个Token都被用在刀刃上。

## 核心理念：Claude思考，Gemini构建

Maflow的核心理念可以用一句话概括："Claude稀缺——用它思考；Gemini丰富——用它构建。"

不同AI模型有不同的优势和能力边界。Claude Sonnet/Opus在复杂推理和架构设计方面表现出色，但成本较高且存在速率限制；Gemini 2.5 Pro/Flash在代码生成方面效率极高，且成本低廉、速率限制宽松。Maflow的工作流根据任务特性智能分配模型，避免用"大炮打蚊子"的浪费。

## 六阶段工作流详解

Maflow将软件开发过程划分为六个明确的阶段，每个阶段由特定的智能体负责，使用最适合的模型：

### 阶段0：项目初始化（Setup）

**执行者**：开发者（零Token成本）

开发者复制Maflow提供的模板文件到项目中，并填写SPEC.md的前三个部分：项目名称、项目范围和技术栈。这个阶段不涉及任何技术决策，仅需5分钟即可完成。

### 阶段1：架构规划（Planning）

**执行者**：Architect智能体
**使用模型**：Claude Sonnet（默认）或Opus（仅复杂项目）
**Token成本**：中等

Architect读取SPEC.md，根据CLAUDE.md中定义的角色规范，产出ARCHITECTURE.md和decisions.md。架构师会提出不超过3个问题澄清需求，然后生成完整的技术架构文档。

### 阶段1.5：架构评审（Plan Review）

**执行者**：开发者（零Token成本）

开发者阅读并审批ARCHITECTURE.md。这是另一个零Token但高影响力的干预点——在写任何代码之前发现并修正架构问题。

### 阶段2：代码实现（Implementation）

**执行者**：Worker智能体
**使用模型**：Gemini 2.5 Pro（复杂逻辑）或Flash（CRUD/模板代码）
**Token成本**：低

Worker根据SPEC.md和ARCHITECTURE.md实现具体功能。由于架构已经明确，Worker可以专注于执行而非探索，大幅提高Token效率。

### 阶段3：并行评估（Evaluation）

**执行者**：三个Evaluator智能体并行运行
**使用模型**：Gemini 2.5 Flash × 3
**Token成本**：极低

三个评估器分别从安全、测试和质量三个维度审查代码，并行运行提高效率。这种并行化设计是Maflow降低总体成本的关键策略之一。

### 阶段4：代码重构（Refactor）

**执行者**：Refactor智能体
**使用模型**：Claude Sonnet
**Token成本**：中等

根据Evaluator的反馈，Refactor智能体修复标记的问题。每个重构会话只处理一个文件，保持会话简短。

### 阶段5与5.5：测试与再评估

Worker编写测试代码（Gemini 2.5 Flash），然后Evaluator再次运行评估。这个循环确保代码质量达标。

### 阶段6：最终评审

**执行者**：开发者（零Token成本）

开发者验证agent-log.md中的记录，确认项目完成。

## 智能体角色与职责

Maflow定义了五种明确的智能体角色，每个角色有特定的职责和适用场景：

| 角色 | 模型 | 使用场景 |
|------|------|----------|
| Architect | Sonnet/Opus | 新项目、新模块、破坏性变更 |
| Worker (Pro) | Gemini 2.5 Pro | 服务层、LLM/RAG、复杂业务逻辑 |
| Worker (Flash) | Gemini 2.5 Flash | CRUD、数据模型、模板代码 |
| Refactor | Claude Sonnet | 复杂逻辑优化、隐藏耦合消除 |
| Evaluator ×3 | Gemini 2.5 Flash | 每个Worker或Refactor会话结束后 |

## 模板文件系统

Maflow通过一套精心设计的模板文件实现智能体间的信息传递和状态管理：

```
multi-agent-workflow/
├── .cursorrules          # Cursor自动注入的会话规则
└── templates/
    ├── SPEC.md           # 开发者填写1-3节，Architect填写4-6节
    ├── CLAUDE.md         # 智能体角色定义和关闭协议
    ├── ARCHITECTURE.md   # Architect产出，Worker遵循
    ├── agent-log.md      # 会话状态，智能体只读最后一条
    └── decisions.md      # 架构决策记录，避免重复讨论
```

每个文件有明确的所有者和读者，确保智能体不会读取不必要的信息。这种"最小知情权"原则显著减少了上下文浪费。

## 关闭协议：状态管理的关键创新

Maflow最具创新性的设计之一是"关闭协议"（Close Protocol）。每个智能体在会话结束时必须按照固定格式输出状态：

```
[日期][角色·模型]
✅ DONE: [完成的文件/功能]
⏳ IN PROGRESS: [进行中的文件/状态，或N/A]
❌ PENDING: [未开始的文件，或N/A]
🚫 BLOCKED: [阻塞原因，或N/A]
➡️ NEXT: [下一个角色·模型 — 具体任务]
```

例如：
- `➡️ NEXT: Worker·Pro — implement user_service.py`
- `➡️ NEXT: Evaluator·Flash — evaluate user_service.py`
- `➡️ NEXT: Refactor·Sonnet — reduce complexity in auth_service.py`

下一个智能体只需阅读这条记录，而非整个代码库，从而避免了重复加载上下文的Token浪费。

## Token效率的四条黄金法则

Maflow总结了四条可复用的效率法则：

1. **每个智能体只读必需文件**：会话开始时没有浪费的上下文
2. **每个会话一个任务——范围扩大时停止**：会话保持简短，成本保持平稳
3. **关闭协议替代代码库重读**：状态一次性写入，无需重建
4. **廉价模型处理廉价任务**：Token预算与任务复杂度匹配

这些法则的复合效应使Maflow能够在保持代码质量的同时，将Token成本控制在传统单一会话方法的1/5到1/10。

## 实际使用流程

使用Maflow进行开发的完整流程如下：

1. **克隆仓库**：`git clone https://github.com/leomejiadev/maflow.git`

2. **复制模板**：将模板文件复制到你的项目中

3. **填写SPEC.md**：开发者填写前三个部分（项目名称、范围、技术栈）

4. **运行Architect**：在Cursor中选择Claude Sonnet，发送指令：`Read SPEC.md. You are the Architect. Follow CLAUDE.md Role: Architect.`

5. **评审架构**：阅读ARCHITECTURE.md，批准或调整

6. **运行Worker**：切换到Gemini 2.5 Pro/Flash，发送实现指令

7. **执行关闭协议**：每个会话结束时发送：`Session complete. Run close protocol now.`

8. **运行Evaluator**：三个并行的Gemini 2.5 Flash会话分别评估安全、测试和质量

9. **循环重构**：根据评估结果，用Claude Sonnet重构，用Gemini测试，再评估

## 适用场景与局限性

Maflow特别适合以下场景：

- 中等复杂度的全栈项目开发
- 需要多轮迭代和持续重构的代码库
- 对Token成本敏感但不愿牺牲质量的团队
- 使用Cursor等支持多模型切换的IDE的开发者

但对于以下场景，Maflow可能不是最佳选择：

- 极简单的脚本或一次性任务
- 需要实时协作的紧急修复
- 团队已经建立了成熟的AI辅助开发流程

## 总结与启示

Maflow的价值不仅在于其具体的工作流设计，更在于它展示了如何通过系统性的方法优化AI辅助开发。其核心启示包括：

1. **模型选择是架构决策**：不同模型有不同优势，合理分配能大幅提高效率
2. **上下文是稀缺资源**：应该像管理计算资源一样管理上下文窗口
3. **结构化优于自由形式**：明确的阶段和协议比开放式对话更高效
4. **人机协作是关键**：在关键节点引入人类判断，避免AI在错误方向上浪费Token

随着AI模型能力的不断提升和成本的持续下降，像Maflow这样的结构化工作流将成为专业开发者的标配。它不仅是一种工具，更是一种思维方式的转变——从"让AI帮我写代码"到"与AI协作完成项目"。