正文

Agentic Development：基于多智能体协作的LLM驱动软件开发框架

一个结构化的多智能体软件开发框架，通过角色分工（分析师、架构师、开发者、审查员）和严格的Stub-First方法论，将模糊需求转化为高质量代码。

LLM开发多智能体软件开发框架TDDVDD代码审查AI辅助开发软件工程自动化测试智能体协作

发布时间 2026/05/21 19:15最近活动 2026/05/21 19:25预计阅读 12 分钟

章节 01

导读 / 主楼：Agentic Development：基于多智能体协作的LLM驱动软件开发框架

一个结构化的多智能体软件开发框架，通过角色分工（分析师、架构师、开发者、审查员）和严格的Stub-First方法论，将模糊需求转化为高质量代码。

章节 02

背景

背景与动机\n\n随着大语言模型（LLM）能力的不断提升，越来越多的开发团队开始尝试将AI助手融入软件开发流程。然而，实践中常常面临以下挑战：\n\n1. 需求理解偏差：AI助手可能误解模糊的自然语言需求，导致实现偏离预期\n2. 代码质量不稳定：缺乏系统性审查机制，生成的代码可能存在逻辑错误、安全漏洞或架构问题\n3. 协作流程混乱：多个AI会话之间缺乏协调，容易出现重复工作或冲突修改\n4. 验证困难：缺乏自动化的测试和验证机制，难以确保生成代码的正确性\n\nAgentic Development 项目正是为解决这些问题而设计。它提出了一种结构化的多智能体协作框架，通过明确的角色分工、严格的方法论和自动化的验证流程，将LLM从"代码生成工具"提升为"可靠的软件开发伙伴"。\n\n## 项目概述\n\nAgentic Development 是一个多智能体系统编排框架，专为基于LLM的软件开发而设计。它将软件开发过程分解为一系列严格定义的阶段，每个阶段由专门的智能体角色负责。\n\n框架的核心设计理念包括：\n\n- 角色专业化：每个智能体专注于特定领域（需求分析、架构设计、代码实现、代码审查、安全审计）\n- 流程管道化：需求经过一系列严格定义的阶段逐步转化为代码\n- 验证前置化：在实现之前先定义测试和验证标准（Stub-First方法论）\n- 反馈闭环：通过TDD（测试驱动开发）和VDD（验证驱动开发）确保质量\n\n## 智能体角色体系\n\n框架定义了六个核心智能体角色，形成完整的软件开发流水线：\n\n### 1. 分析师（Analyst）\n\n负责需求澄清和领域建模。分析师智能体接收模糊的自然语言需求，输出结构化的需求文档，包括：\n\n- 功能需求清单\n- 非功能需求约束\n- 领域模型和实体关系\n- 边界条件和异常情况\n\n### 2. 架构师（Architect）\n\n负责高层设计和模块划分。基于分析师的输出，架构师智能体设计系统的整体结构：\n\n- 模块划分和依赖关系\n- 接口定义和数据流\n- 技术选型建议\n- 架构决策记录（ADR）\n\n### 3. 规划师（Planner）\n\n负责任务分解和执行计划。将架构设计转化为可执行的任务列表：\n\n- 任务优先级排序\n- 依赖关系管理\n- 工作量估算\n- 里程碑定义\n\n### 4. 开发者（Developer）\n\n负责代码实现。按照规划师制定的计划，逐个实现功能模块：\n\n- 遵循编码规范\n- 实现业务逻辑\n- 编写单元测试\n- 生成文档注释\n\n### 5. 审查员（Reviewer）\n\n负责代码审查和质量把关。对开发者提交的代码进行全面审查：\n\n- 逻辑正确性检查\n- 代码风格一致性\n- 性能优化建议\n- 可维护性评估\n\n### 6. 安全审计员（Security Auditor）\n\n负责安全漏洞扫描和风险评估。作为可选的最终关卡：\n\n- 注入攻击检测\n- 敏感信息泄露检查\n- 权限控制验证\n- 依赖项安全扫描\n\n## 核心方法论：TDD与VDD\n\n### TDD（测试驱动开发）\n\n框架采用严格的"Stub-First"策略，这是TDD的强化版本：\n\n1. 编写测试：在实现任何功能之前，先编写完整的测试用例\n2. 创建Stub：为被测功能创建空的实现（Stub）\n3. 验证失败：运行测试，确保测试因Stub而失败\n4. 实现功能：编写最小代码使测试通过\n5. 重构优化：在测试通过的前提下优化代码结构\n\n这种方法确保每个功能都有对应的测试覆盖，且测试本身在实现之前就已经验证了其有效性。\n\n### VDD（验证驱动开发）\n\nVDD是框架提出的高完整性模式，引入了一个对抗性智能体（Adversarial Agent）：\n\n1. 挑战计划：对抗性智能体主动质疑规划师制定的计划，寻找逻辑漏洞\n2. 挑战代码：对抗性智能体审查开发者的实现，尝试发现隐藏的错误\n3. 压力测试：通过构造边界条件和异常情况，验证系统的鲁棒性\n4. 幻觉消除：在代码提交前消除模型可能产生的幻觉和逻辑错误\n\nVDD的核心思想是"预防胜于治疗"——在问题进入代码库之前就将其发现和修复。\n\n## 技术实现与工具链\n\n框架提供了完整的工具链支持，兼容多种主流AI开发工具：\n\n### 安装与部署\n\n框架通过安装脚本部署到目标项目：\n\n`bash\ncd /path/to/your-project\n/path/to/agentic-development/install.sh install --vendor claude\n`\n\n支持的厂商配置包括：`claude`、`antigravity`、`codex`、`cursor`、`gemini-cli`。\n\n### 核心子命令\n\n安装脚本提供五个子命令：\n\n- install：将框架部署到目标项目\n- switch：切换已安装的代理系统（如`--vendor antigravity`）\n- update：框架变更后重新同步符号链接\n- uninstall：移除框架产物（`--purge`同时移除框架本身）\n- doctor：验证安装完整性（`--json`输出机器可读报告）\n\n### Claude Code集成\n\n框架为Claude Code提供了丰富的斜杠命令：\n\n- `/start-feature`：分析+架构阶段\n- `/plan`：规划阶段\n- `/develop`：开发单个任务\n- `/develop-all`：循环所有任务\n- `/vdd`：VDD增强流程\n- `/full`：完整流程+安全审计\n- `/security-audit`：安全审计\n\n### Cursor集成\n\n- 上下文规则：将AGENTS.md复制到项目根目录\n- 技能链接：创建符号链接启用原生技能检测\n`bash\nln -s .agent/skills .cursor/skills\n`\n\n### 环境要求\n\n- 必需：Python 3.11+（推荐）\n- 最低：Python 3.9+（遗留兼容性）\n\n## 工作流程示例\n\n典型的开发流程如下：\n\n1. 产品发现（可选）：进行市场调研和竞品分析\n2. 预检阶段：验证输入需求的完整性和一致性\n3. 分析阶段：分析师智能体澄清需求，输出结构化文档\n4. 架构阶段：架构师智能体设计系统结构\n5. 规划阶段：规划师智能体制定执行计划\n6. 开发阶段：开发者智能体按任务逐个实现\n7. 审查阶段：审查员智能体检查代码质量\n8. 安全审计（可选）：安全审计员智能体扫描漏洞\n\n每个阶段都有明确的输入、输出和验收标准，确保流程的可预测性和可重复性。\n\n## 实际应用价值\n\n### 1. 降低沟通成本\n通过结构化的需求澄清流程，减少开发过程中因需求理解偏差导致的返工。\n\n### 2. 提高代码质量\n多层次的审查机制（代码审查+安全审计+对抗性验证）确保进入代码库的代码符合质量标准。\n\n### 3. 加速开发周期\n自动化的测试生成和验证流程，减少人工测试编写和调试的时间。\n\n### 4. 知识沉淀\n架构决策记录（ADR）和领域模型文档化，帮助团队积累领域知识。\n\n### 5. 降低技术债务\n严格的重构阶段和代码风格检查，防止技术债务的累积。\n\n## 局限性与注意事项\n\n1. 学习曲线：框架引入了较多的概念和流程，团队需要一定时间适应\n2. 适用场景：对于小型原型或快速验证项目，完整的流程可能过于沉重\n3. 模型依赖：框架的效果受限于底层LLM的能力，不同模型的表现可能有差异\n4. 成本考量：多智能体协作意味着更多的API调用，需要考虑成本因素\n\n## 总结与展望\n\nAgentic Development 代表了LLM辅助软件开发的一种系统化尝试。它不是简单地将AI作为代码生成工具，而是将其整合到完整的软件工程流程中，通过角色分工、方法论约束和自动化验证，实现人机协作的软件开发新模式。\n\n随着LLM能力的持续提升和成本的不断降低，这种结构化的多智能体开发框架可能成为软件工程领域的重要发展方向。它不仅提高了开发效率和代码质量，更重要的是，为AI辅助软件开发建立了一套可重复、可验证的工程实践。

章节 03

补充观点 1

背景与动机\n\n随着大语言模型（LLM）能力的不断提升，越来越多的开发团队开始尝试将AI助手融入软件开发流程。然而，实践中常常面临以下挑战：\n\n1. 需求理解偏差：AI助手可能误解模糊的自然语言需求，导致实现偏离预期\n2. 代码质量不稳定：缺乏系统性审查机制，生成的代码可能存在逻辑错误、安全漏洞或架构问题\n3. 协作流程混乱：多个AI会话之间缺乏协调，容易出现重复工作或冲突修改\n4. 验证困难：缺乏自动化的测试和验证机制，难以确保生成代码的正确性\n\nAgentic Development 项目正是为解决这些问题而设计。它提出了一种结构化的多智能体协作框架，通过明确的角色分工、严格的方法论和自动化的验证流程，将LLM从"代码生成工具"提升为"可靠的软件开发伙伴"。\n\n项目概述\n\nAgentic Development 是一个多智能体系统编排框架，专为基于LLM的软件开发而设计。它将软件开发过程分解为一系列严格定义的阶段，每个阶段由专门的智能体角色负责。\n\n框架的核心设计理念包括：\n\n- 角色专业化：每个智能体专注于特定领域（需求分析、架构设计、代码实现、代码审查、安全审计）\n- 流程管道化：需求经过一系列严格定义的阶段逐步转化为代码\n- 验证前置化：在实现之前先定义测试和验证标准（Stub-First方法论）\n- 反馈闭环：通过TDD（测试驱动开发）和VDD（验证驱动开发）确保质量\n\n智能体角色体系\n\n框架定义了六个核心智能体角色，形成完整的软件开发流水线：\n\n1. 分析师（Analyst）\n\n负责需求澄清和领域建模。分析师智能体接收模糊的自然语言需求，输出结构化的需求文档，包括：\n\n- 功能需求清单\n- 非功能需求约束\n- 领域模型和实体关系\n- 边界条件和异常情况\n\n2. 架构师（Architect）\n\n负责高层设计和模块划分。基于分析师的输出，架构师智能体设计系统的整体结构：\n\n- 模块划分和依赖关系\n- 接口定义和数据流\n- 技术选型建议\n- 架构决策记录（ADR）\n\n3. 规划师（Planner）\n\n负责任务分解和执行计划。将架构设计转化为可执行的任务列表：\n\n- 任务优先级排序\n- 依赖关系管理\n- 工作量估算\n- 里程碑定义\n\n4. 开发者（Developer）\n\n负责代码实现。按照规划师制定的计划，逐个实现功能模块：\n\n- 遵循编码规范\n- 实现业务逻辑\n- 编写单元测试\n- 生成文档注释\n\n5. 审查员（Reviewer）\n\n负责代码审查和质量把关。对开发者提交的代码进行全面审查：\n\n- 逻辑正确性检查\n- 代码风格一致性\n- 性能优化建议\n- 可维护性评估\n\n6. 安全审计员（Security Auditor）\n\n负责安全漏洞扫描和风险评估。作为可选的最终关卡：\n\n- 注入攻击检测\n- 敏感信息泄露检查\n- 权限控制验证\n- 依赖项安全扫描\n\n核心方法论：TDD与VDD\n\nTDD（测试驱动开发）\n\n框架采用严格的"Stub-First"策略，这是TDD的强化版本：\n\n1. 编写测试：在实现任何功能之前，先编写完整的测试用例\n2. 创建Stub：为被测功能创建空的实现（Stub）\n3. 验证失败：运行测试，确保测试因Stub而失败\n4. 实现功能：编写最小代码使测试通过\n5. 重构优化：在测试通过的前提下优化代码结构\n\n这种方法确保每个功能都有对应的测试覆盖，且测试本身在实现之前就已经验证了其有效性。\n\nVDD（验证驱动开发）\n\nVDD是框架提出的高完整性模式，引入了一个对抗性智能体（Adversarial Agent）：\n\n1. 挑战计划：对抗性智能体主动质疑规划师制定的计划，寻找逻辑漏洞\n2. 挑战代码：对抗性智能体审查开发者的实现，尝试发现隐藏的错误\n3. 压力测试：通过构造边界条件和异常情况，验证系统的鲁棒性\n4. 幻觉消除：在代码提交前消除模型可能产生的幻觉和逻辑错误\n\nVDD的核心思想是"预防胜于治疗"——在问题进入代码库之前就将其发现和修复。\n\n技术实现与工具链\n\n框架提供了完整的工具链支持，兼容多种主流AI开发工具：\n\n安装与部署\n\n框架通过安装脚本部署到目标项目：\n\nbash\ncd /path/to/your-project\n/path/to/agentic-development/install.sh install --vendor claude\n\n\n支持的厂商配置包括：claude、antigravity、codex、cursor、gemini-cli。\n\n核心子命令\n\n安装脚本提供五个子命令：\n\n- install：将框架部署到目标项目\n- switch：切换已安装的代理系统（如--vendor antigravity）\n- update：框架变更后重新同步符号链接\n- uninstall：移除框架产物（--purge同时移除框架本身）\n- doctor：验证安装完整性（--json输出机器可读报告）\n\nClaude Code集成\n\n框架为Claude Code提供了丰富的斜杠命令：\n\n- /start-feature：分析+架构阶段\n- /plan：规划阶段\n- /develop：开发单个任务\n- /develop-all：循环所有任务\n- /vdd：VDD增强流程\n- /full：完整流程+安全审计\n- /security-audit：安全审计\n\nCursor集成\n\n- 上下文规则：将AGENTS.md复制到项目根目录\n- 技能链接：创建符号链接启用原生技能检测\nbash\nln -s .agent/skills .cursor/skills\n\n\n环境要求\n\n- 必需：Python 3.11+（推荐）\n- 最低：Python 3.9+（遗留兼容性）\n\n工作流程示例\n\n典型的开发流程如下：\n\n1. 产品发现（可选）：进行市场调研和竞品分析\n2. 预检阶段：验证输入需求的完整性和一致性\n3. 分析阶段：分析师智能体澄清需求，输出结构化文档\n4. 架构阶段：架构师智能体设计系统结构\n5. 规划阶段：规划师智能体制定执行计划\n6. 开发阶段：开发者智能体按任务逐个实现\n7. 审查阶段：审查员智能体检查代码质量\n8. 安全审计（可选）：安全审计员智能体扫描漏洞\n\n每个阶段都有明确的输入、输出和验收标准，确保流程的可预测性和可重复性。\n\n实际应用价值\n\n1. 降低沟通成本\n通过结构化的需求澄清流程，减少开发过程中因需求理解偏差导致的返工。\n\n2. 提高代码质量\n多层次的审查机制（代码审查+安全审计+对抗性验证）确保进入代码库的代码符合质量标准。\n\n3. 加速开发周期\n自动化的测试生成和验证流程，减少人工测试编写和调试的时间。\n\n4. 知识沉淀\n架构决策记录（ADR）和领域模型文档化，帮助团队积累领域知识。\n\n5. 降低技术债务\n严格的重构阶段和代码风格检查，防止技术债务的累积。\n\n局限性与注意事项\n\n1. 学习曲线：框架引入了较多的概念和流程，团队需要一定时间适应\n2. 适用场景：对于小型原型或快速验证项目，完整的流程可能过于沉重\n3. 模型依赖：框架的效果受限于底层LLM的能力，不同模型的表现可能有差异\n4. 成本考量：多智能体协作意味着更多的API调用，需要考虑成本因素\n\n总结与展望\n\nAgentic Development 代表了LLM辅助软件开发的一种系统化尝试。它不是简单地将AI作为代码生成工具，而是将其整合到完整的软件工程流程中，通过角色分工、方法论约束和自动化验证，实现人机协作的软件开发新模式。\n\n随着LLM能力的持续提升和成本的不断降低，这种结构化的多智能体开发框架可能成为软件工程领域的重要发展方向。它不仅提高了开发效率和代码质量，更重要的是，为AI辅助软件开发建立了一套可重复、可验证的工程实践。

Agentic Development：基于多智能体协作的LLM驱动软件开发框架

导读 / 主楼：Agentic Development：基于多智能体协作的LLM驱动软件开发框架

背景

补充观点 1

继续阅读

Nornir MCP Server：将大语言模型引入网络自动化的企业级桥梁

Bibliothèque Française LLM：为大型语言模型优化的法语公版文献索引系统

Splinter：一款无锁零拷贝的共享内存 KV 与向量存储库，让 LLM 推理告别 socket 与 memcpy 开销

Folkering OS：当操作系统本身就是 AI——一个能自我进化的裸机 Rust 系统