# AI-Whisper：终端原生的 Claude + Codex 双智能体协作编排系统

> AI-Whisper 是一个创新的终端优先的 AI 编程智能体协作平台，它将 Claude 和 Codex 两个编码智能体整合为一对可以自主协作的搭档。通过结构化工作流驱动，一个智能体负责实现，另一个负责审查，通过"指挥棒"机制确保每次只有一个智能体拥有执行权，实现无需人工持续监督的自主开发-审查闭环。

- 板块: [Openclaw Llm](https://www.zingnex.cn/forum/board/openclaw-llm)
- 发布时间: 2026-05-24T12:45:08.000Z
- 最近活动: 2026-05-24T12:53:09.721Z
- 热度: 169.9
- 关键词: Claude, Codex, AI coding agents, multi-agent, terminal-first, workflow automation, code review, baton handoff, structured workflow, spec-driven development, TypeScript, CLI, developer tools
- 页面链接: https://www.zingnex.cn/forum/thread/ai-whisper-claude-codex
- Canonical: https://www.zingnex.cn/forum/thread/ai-whisper-claude-codex
- Markdown 来源: ingested_event

---

## 原作者与来源

- 原作者/维护者：ai-creed
- 来源平台：github
- 原始标题：ai-whisper
- 原始链接：https://github.com/ai-creed/ai-whisper
- 来源发布时间/更新时间：2026-05-24T12:45:08Z

## 原作者与来源\n\n- **原作者/维护者**: ai-creed\n- **来源平台**: GitHub\n- **原始标题**: ai-whisper\n- **原始链接**: https://github.com/ai-creed/ai-whisper\n- **发布时间**: 2026-05-24\n\n---\n\n## 项目概述\n\nAI-Whisper 是一个突破性的终端原生 AI 编程协作工具，它解决了单个 AI 编码助手缺乏代码审查能力的痛点。项目将 Claude 和 Codex 两个业界领先的编码智能体整合为一对可以自主协作的搭档，通过结构化工作流实现"实现-审查"的自动化闭环。\n\n核心理念是**指挥棒传递机制**（baton handoff）——两个智能体从不同时工作，而是通过一个明确的权限令牌来决定当前谁拥有执行权。发起工作流的智能体自动成为"实现者"（implementer），另一个则成为"审查者"（reviewer）。实现者完成每个步骤后将结果提交，由 LLM 评估器判断是否符合要求；如果不符合，审查者的反馈会被整合为后续指令，实现者据此迭代，直到工作通过审查或达到轮次上限。\n\n---\n\n## 核心设计哲学\n\n### 不是群体智能，而是结构化协作\n\nAI-Whisper 明确区别于"群体智能"（swarm）架构。在群体智能中，多个智能体可能同时行动，导致冲突和混乱。而 AI-Whisper 采用严格的串行执行模型：\n\n- **单一指挥棒**：任何时刻只有一个智能体拥有执行权\n- **真实终端会话**：每个智能体在自己的真实终端会话中运行，而非虚拟环境\n- **监督式自主**：所有交接、裁决和轮次都可检查，运行可恢复而非一次性任务\n- **工作流优先**：明确的循环和状态转换，而非自由形式的对话\n\n这种设计确保了可预测性和可调试性——开发者可以清楚地看到每个智能体在做什么，为什么做，以及结果如何。\n\n### 终端原生体验\n\n项目坚持"终端优先"（terminal-first）的理念。与基于 Web UI 的 AI 编程工具不同，AI-Whisper 让智能体生活在真实的终端会话中：\n\n```\n终端 1\nwhisper collab mount claude\n\n终端 2\nwhisper collab mount codex\n```\n\n这种设计让开发者可以在熟悉的终端环境中与智能体交互，同时保留对会话的完全控制。每个挂载会声明当前 shell，启动真实的提供商 CLI，并将其绑定到协作会话。\n\n---\n\n## 工作流程详解\n\n### 启动协作会话\n\n首先需要在两个终端分别挂载两个智能体：\n\n1. 第一个挂载创建协作会话并启动工作空间的代理守护进程\n2. 第二个挂载将另一个智能体绑定到同一会话\n\n挂载完成后，可以从任一会话中启动结构化工作流：\n\n```\nRun spec-driven-development using docs/spec.md\n```\n\n### 自主执行流程\n\n一旦工作流启动，AI-Whisper 将自主运行以下循环：\n\n**1. 角色分配**\n\n触发工作流的智能体自动成为实现者，另一个成为审查者。也可以通过 `--implementer` 和 `--reviewer` 参数显式指定。\n\n**2. 实现阶段**\n\n实现者在真实会话中执行每个步骤，完成后将结果提交回系统。\n\n**3. LLM 评估**\n\n一个独立的 LLM 评估器判断交付物是否满足请求。这是工作流的"守门人"机制。\n\n**4. 审查循环**\n\n如果工作未达到标准，审查者的发现会被整合为后续指令，实现者据此迭代。循环重复直到工作通过审查或达到轮次预算上限。\n\n**5. 可恢复性**\n\n工作流和链状态是持久化的。如果代理重启或需要暂停，可以恢复并重新连接，而非从头开始。\n\n**6. 交付物**\n\n最终产出包括提交的代码和审查轨迹（每步裁决、轮次计数），可通过 `whisper collab dashboard` 随时查看。\n\n---\n\n## 安全与权限设计\n\n### 完全自主模式的风险管理\n\nAI-Whisper 以完全自主模式启动每个智能体（`claude --dangerously-skip-permissions` 和 `codex --dangerously-bypass-approvals-and-sandbox`），以便中继可以无人值守地驱动它们。\n\n这意味着在挂载的工作空间内，智能体可以：\n- 读取文件\n- 写入文件\n- 执行命令\n- 无需提示即可操作\n\n### 安全建议\n\n项目文档明确建议：\n- 指向你愿意让两个智能体自主修改的代码\n- 在仪表板上观察运行过程\n- 记住你是最终的守门人——在发布前审查结果\n\n这种设计体现了对 AI 自主性的务实态度：给予智能体足够的权限以提高效率，同时保持人类在关键决策点的监督权。\n\n---\n\n## 技术架构与实现\n\n### 技术栈\n\n- **TypeScript** (92.5%) — 主要开发语言\n- **JavaScript** (3.8%)\n- **Shell** (3.7%)\n\n### 项目结构\n\n项目采用 pnpm workspaces 管理的 monorepo 结构：\n\n```\npackages/\n  cli/           # 命令行界面\n  core/          # 核心逻辑\n  skills/        # 智能体技能（bundled agent skills）\n```\n\n### 关键依赖\n\n- **Node.js 22+** — 运行时要求\n- **Claude Code CLI** — 必须安装并登录\n- **Codex CLI** — 必须安装并登录\n- **tmux**（可选）— 仅用于 `whisper collab start`，自动将两个智能体排列到窗格\n- **LLM 评估器** — 工作流的必需组件，需要配置凭证\n\n### 智能体技能系统\n\n项目包含一套"技能"（skills），让智能体能够：\n- 验证工作流\n- 启动工作流\n- 报告工作流状态\n\n通过 `whisper skill install` 一次性安装这些技能。\n\n---\n\n## 故障处理与恢复\n\n### 设计化的升级机制\n\n当运行中断时，系统通常不会崩溃，而是"升级"（escalate）——将控制权交还给人类。触发升级的情况包括：\n\n- 评估器无法解决某个阶段（轮次预算耗尽）\n- 智能体报告被阻塞\n- 置信度持续过低\n\n这不是失败，而是设计好的退出机制。运行状态是持久化的，因此你可以：\n\n1. 查看仪表板了解当前状态\n2. 修复规范或解除智能体阻塞\n3. 使用 `whisper workflow resume <id>` 从断点恢复\n\n升级是系统在恰当时机请求人类干预的方式，看到升级是正常的，不代表系统损坏。\n\n---\n\n## 两种核心工作流模式\n\n### 1. 规范驱动开发（spec-driven-development）\n\n适用于有明确规范文档的场景。智能体根据 `docs/spec.md` 中的规范进行实现和审查。\n\n### 2. 开放式目标循环（ralph-loop）\n\n适用于开放式目标而非严格规范的场景。智能体根据目标文件进行迭代探索和实现。\n\n---\n\n## 适用场景与限制\n\n### 适合使用 AI-Whisper 的场景\n\n- 你已经重度依赖编码智能体，希望两个智能体互相检查\n- 你习惯终端优先的工作方式，希望智能体生活在真实终端会话中\n- 你需要多智能体审查——第二个模型把关第一个模型的输出\n- 你运行长周期的结构化工作流（规范 → 计划 → 实现 → 审查），而非一次性提示\n\n### 不适合的场景\n\n- 一次性"氛围编程"（vibe coding），你只是想要快速答案\n- 你永远不会观察的隐形后台自动化\n- 刚接触编码智能体，需要手把手引导体验的新手\n\n---\n\n## 快速开始指南\n\n### 安装\n\n从 npm 安装：\n```bash\nnpm install -g ai-whisper\n```\n\n或从仓库检出：\n```bash\npnpm install\npnpm build\n```\n\n### 配置\n\n1. 安装捆绑的智能体技能：\n```bash\nwhisper skill install\n```\n\n2. 配置 LLM 评估器凭证（必需）\n\n### 运行\n\n1. 在两个终端分别挂载两个智能体\n2. 从任一会话启动工作流\n3. 使用仪表板观察运行：\n```bash\nwhisper collab dashboard\n```\n\n---\n\n## 对 AI 编程工具发展的启示\n\nAI-Whisper 代表了 AI 编程助手进化的一个新方向——从单一智能体到多智能体协作，从即时响应到结构化工作流，从完全自主到监督式自主。\n\n它的核心创新在于：\n\n1. **明确的协作协议**：指挥棒机制定义了清晰的权限边界\n2. **可恢复的执行状态**：长周期任务可以安全地中断和恢复\n3. **人类在环设计**：升级机制确保人类在关键时刻保持控制\n4. **终端原生体验**：尊重开发者现有的工作流和工具偏好\n\n对于希望将 AI 编程助手从"代码补全工具"升级为"开发伙伴"的团队，AI-Whisper 提供了一个值得参考的架构模式。\n\n---\n\n## 许可证与贡献\n\n- **许可证**: Apache License 2.0\n- **贡献**: 接受开发者证书原产地（Developer Certificate of Origin）签署的贡献\n- **提交格式**: `git commit -s`\n\n---\n\n## 总结\n\nAI-Whisper 是一个雄心勃勃的项目，它尝试解决 AI 编程助手领域的一个核心挑战：如何在保持高效率的同时确保代码质量。通过引入第二个智能体作为审查者，并通过精心设计的指挥棒机制协调两者，项目为"AI 结对编程"提供了一个实用的实现方案。对于已经在使用 Claude 和 Codex 的开发者来说，这是一个值得尝试的工具，可能会显著提升复杂开发任务的自动化水平。
