正文

Microsoft Conductor：用YAML编排多智能体工作流的CLI工具

Microsoft Conductor是一个开源CLI工具，允许开发者使用YAML定义多智能体工作流，支持GitHub Copilot和Anthropic Claude双后端，提供并行执行、人机协作、安全限制等生产级功能。

Microsoft Conductor多智能体工作流YAML编排GitHub CopilotAnthropic Claude人机协作并行执行AI Agent

发布时间 2026/04/18 03:15最近活动 2026/04/18 03:21预计阅读 14 分钟

章节 01

导读 / 主楼：Microsoft Conductor：用YAML编排多智能体工作流的CLI工具

章节 02

背景

Microsoft Conductor：用YAML编排多智能体工作流的CLI工具\n\n## 项目背景与问题定义\n\n单个LLM提示可以回答问题，但它无法审查自己的工作、从多个角度进行研究，或在关键节点暂停等待人类批准。构建真正的多智能体工作流意味着需要处理状态管理、故障恢复、无限循环防护等复杂问题——这些正是Microsoft Conductor试图解决的痛点。\n\nConductor是一款由微软开源的CLI工具，它提供了一套经过验证的工作流模式：评估-优化循环用于迭代精炼、并行执行配合故障处理、以及人机协作节点。开发者可以用可读的YAML格式定义这些工作流，并像管理代码一样进行版本控制。\n\n## 核心设计理念\n\n### YAML优先的工作流定义\n\nConductor最大的特色是将工作流定义从代码中抽离出来，使用声明式的YAML格式。这种设计带来了几个显著优势：\n\n首先，工作流变得可读且可维护。非技术背景的团队成员也能理解流程逻辑，产品经理可以直接参与工作流设计。其次，YAML文件天然适合版本控制，工作流的变更历史一目了然。最后，这种分离使得工作流可以在不同环境间轻松迁移，只需修改少量配置即可切换AI提供商。\n\n### 多提供商支持\n\nConductor目前支持两种主流AI后端：\n\n- GitHub Copilot：适合已有订阅的用户，支持MCP工具调用，提供8K-128K的上下文窗口\n- Anthropic Claude：按需付费模式，提供高达200K的上下文窗口，适合处理长文档\n\n这种双后端设计让用户可以根据具体场景灵活选择，甚至可以在不同工作流中使用不同的提供商。\n\n## 关键功能详解\n\n### 并行执行能力\n\nConductor支持两种并行模式：\n\n静态并行组：在YAML中预定义多个代理同时执行，适用于需要多维度分析的场景。例如，可以并行运行"技术可行性分析"、"市场影响评估"和"风险评估"三个代理，然后将结果汇总。\n\n动态For-Each循环：基于输入数组动态创建并行任务。比如输入是一个包含10个产品描述的列表，Conductor会自动为每个描述启动独立的分析代理，最后收集所有结果。\n\n### 人机协作节点\n\n在生产环境中，完全自动化的AI工作流往往存在风险。Conductor内置了"人类决策门"（human-in-the-loop gates），允许在关键节点暂停执行，通过Rich终端UI或Web仪表盘等待人工确认。\n\n这一功能在以下场景尤为重要：代码部署前的最终审查、涉及敏感数据的处理步骤、以及需要人工判断的创意决策。\n\n### 安全限制机制\n\n为了防止无限循环和资源耗尽，Conductor内置了多层安全防护：\n\n- 最大迭代次数：防止评估-优化循环无限运行\n- 超时控制：单个步骤和整个工作流都有超时限制\n- 条件路由：基于代理输出动态决定下一步走向\n\n这些机制确保了工作流在异常情况下能够优雅降级，而不是陷入不可控状态。\n\n## 实时Web仪表盘\n\nConductor内置了一个功能丰富的Web仪表盘，可以通过`--web`参数启动。这个仪表盘提供了：\n\n### 交互式DAG图\n\n可缩放、可拖拽的工作流图，带有动画边线显示执行流向和条件路由。用户可以直观地看到当前执行到哪个节点，以及数据是如何在代理间流动的。\n\n### 实时流式输出\n\n代理的推理过程、工具调用和输出结果会实时流式显示在浏览器中。这种透明度对于调试复杂工作流至关重要，开发者可以精确追踪每个决策是如何做出的。\n\n### 浏览器内人机协作\n\n当工作流遇到人类决策门时，用户可以直接在浏览器中做出选择，无需返回终端。这大大降低了协作门槛，使得非技术团队成员也能参与工作流执行。\n\n### 后台运行模式\n\n使用`--web-bg`参数可以让仪表盘在后台运行，打印URL后退出。之后可以使用`conductor stop`命令终止工作流。这一模式适合长时间运行的任务，用户无需保持终端开启。\n\n## 典型使用示例\n\n### 简单问答工作流\n\n`yaml\nworkflow:\n name: simple-qa\n description: A simple question-answering workflow\n entry_point: answerer\n\nagents:\n - name: answerer\n model: gpt-5.2\n prompt: |\n Answer the following question:\n {{ workflow.input.question }}\n output:\n answer:\n type: string\n routes:\n - to: $end\n\noutput:\n answer: \"{{ answerer.output.answer }}\"\n`\n\n执行命令：`conductor run my-workflow.yaml --input question="What is Python?"`\n\n### 设计评审工作流（含人机协作）\n\n这个示例展示了如何在设计评审流程中引入人工决策点：\n\n1. 初始代理生成设计文档\n2. 评审代理检查设计并提出修改建议\n3. 人机协作节点询问是否接受修改建议\n4. 如果接受，返回步骤1迭代改进；如果拒绝，进入最终输出\n\n这种模式确保了AI辅助不会取代人类判断，而是在关键节点提供建议并等待确认。\n\n### 脚本步骤与条件路由\n\nConductor还支持纯脚本步骤，无需AI代理参与。例如，可以在工作流中插入shell命令检查磁盘空间，然后根据退出码决定是继续执行还是报错终止。\n\n`yaml\nagents:\n - name: check_disk\n type: script\n command: \"df -h / | awk 'NR==2 {print $5}' | sed 's/%//'\"\n routes:\n - condition: \"{{ output.exit_code == 0 and output.stdout | int < 90 }}\"\n to: next_step\n - condition: \"{{ output.stdout | int >= 90 }}\"\n to: cleanup_step\n`\n\n## 与同类工具的对比\n\n| 特性 | Conductor | LangGraph | AutoGen | CrewAI |\n|------|-----------|-----------|---------|--------|\n| 配置方式 | YAML | Python代码 | Python代码 | Python代码 |\n| 人机协作 | 内置 | 需自定义 | 需自定义 | 有限支持 |\n| Web仪表盘 | 内置 | 需额外配置 | 无 | 无 |\n| 多提供商 | Copilot/Claude | 任意 | 任意 | 任意 |\n| 并行执行 | 原生支持 | 支持 | 支持 | 支持 |\n| 安全限制 | 内置 | 需自定义 | 需自定义 | 需自定义 |\n\nConductor的优势在于其声明式配置和开箱即用的生产级功能，特别适合希望快速搭建稳定工作流而不想编写大量样板代码的团队。\n\n## 技术实现与生态\n\nConductor基于Python 3.12+开发，使用`uv`进行依赖管理。项目采用模块化架构，核心组件包括：\n\n- 工作流解析器：将YAML转换为内部执行图\n- 代理调度器：管理Copilot CLI或Claude API的调用\n- 状态管理器：持久化工作流执行状态\n- Web服务器：为仪表盘提供实时数据流\n\n项目遵循微软开源行为准则，采用MIT许可证，欢迎社区贡献。目前已包含7个完整示例工作流，涵盖从简单问答到复杂并行处理的多种场景。\n\n## 适用场景与部署建议\n\n### 最佳适用场景\n\n1. 内容审核流水线：需要多轮评估和人工确认的内容发布流程\n2. 代码审查自动化：并行运行多个检查代理，汇总结果后人工决策\n3. 研究助理工作流：多维度信息收集、交叉验证、报告生成\n4. 客户服务分诊：根据查询类型路由到不同专业代理\n\n### 部署注意事项\n\n对于生产环境部署，建议：\n\n- 使用`--log-file`参数记录完整执行日志，便于审计和故障排查\n- 为长时间运行的工作流设置合理的超时值\n- 利用`--dry-run`预览执行计划，避免意外资源消耗\n- 对于敏感数据，优先使用本地Claude部署而非云端API\n\n## 总结与展望\n\nMicrosoft Conductor代表了一种务实的多智能体工作流构建方式。它不追求覆盖所有可能的AI交互模式，而是专注于提供一套稳定、可维护、生产就绪的基础功能。YAML配置方式降低了使用门槛，内置的安全机制和Web仪表盘则确保了工作流的可控性和可观测性。\n\n随着AI Agent生态的成熟，像Conductor这样的编排工具将变得越来越重要。它让开发者可以专注于业务逻辑而非基础设施，是构建可靠AI应用的重要基础设施组件。

章节 03

补充观点 1

Microsoft Conductor：用YAML编排多智能体工作流的CLI工具\n\n项目背景与问题定义\n\n单个LLM提示可以回答问题，但它无法审查自己的工作、从多个角度进行研究，或在关键节点暂停等待人类批准。构建真正的多智能体工作流意味着需要处理状态管理、故障恢复、无限循环防护等复杂问题——这些正是Microsoft Conductor试图解决的痛点。\n\nConductor是一款由微软开源的CLI工具，它提供了一套经过验证的工作流模式：评估-优化循环用于迭代精炼、并行执行配合故障处理、以及人机协作节点。开发者可以用可读的YAML格式定义这些工作流，并像管理代码一样进行版本控制。\n\n核心设计理念\n\nYAML优先的工作流定义\n\nConductor最大的特色是将工作流定义从代码中抽离出来，使用声明式的YAML格式。这种设计带来了几个显著优势：\n\n首先，工作流变得可读且可维护。非技术背景的团队成员也能理解流程逻辑，产品经理可以直接参与工作流设计。其次，YAML文件天然适合版本控制，工作流的变更历史一目了然。最后，这种分离使得工作流可以在不同环境间轻松迁移，只需修改少量配置即可切换AI提供商。\n\n多提供商支持\n\nConductor目前支持两种主流AI后端：\n\n- GitHub Copilot：适合已有订阅的用户，支持MCP工具调用，提供8K-128K的上下文窗口\n- Anthropic Claude：按需付费模式，提供高达200K的上下文窗口，适合处理长文档\n\n这种双后端设计让用户可以根据具体场景灵活选择，甚至可以在不同工作流中使用不同的提供商。\n\n关键功能详解\n\n并行执行能力\n\nConductor支持两种并行模式：\n\n静态并行组：在YAML中预定义多个代理同时执行，适用于需要多维度分析的场景。例如，可以并行运行"技术可行性分析"、"市场影响评估"和"风险评估"三个代理，然后将结果汇总。\n\n动态For-Each循环：基于输入数组动态创建并行任务。比如输入是一个包含10个产品描述的列表，Conductor会自动为每个描述启动独立的分析代理，最后收集所有结果。\n\n人机协作节点\n\n在生产环境中，完全自动化的AI工作流往往存在风险。Conductor内置了"人类决策门"（human-in-the-loop gates），允许在关键节点暂停执行，通过Rich终端UI或Web仪表盘等待人工确认。\n\n这一功能在以下场景尤为重要：代码部署前的最终审查、涉及敏感数据的处理步骤、以及需要人工判断的创意决策。\n\n安全限制机制\n\n为了防止无限循环和资源耗尽，Conductor内置了多层安全防护：\n\n- 最大迭代次数：防止评估-优化循环无限运行\n- 超时控制：单个步骤和整个工作流都有超时限制\n- 条件路由：基于代理输出动态决定下一步走向\n\n这些机制确保了工作流在异常情况下能够优雅降级，而不是陷入不可控状态。\n\n实时Web仪表盘\n\nConductor内置了一个功能丰富的Web仪表盘，可以通过--web参数启动。这个仪表盘提供了：\n\n交互式DAG图\n\n可缩放、可拖拽的工作流图，带有动画边线显示执行流向和条件路由。用户可以直观地看到当前执行到哪个节点，以及数据是如何在代理间流动的。\n\n实时流式输出\n\n代理的推理过程、工具调用和输出结果会实时流式显示在浏览器中。这种透明度对于调试复杂工作流至关重要，开发者可以精确追踪每个决策是如何做出的。\n\n浏览器内人机协作\n\n当工作流遇到人类决策门时，用户可以直接在浏览器中做出选择，无需返回终端。这大大降低了协作门槛，使得非技术团队成员也能参与工作流执行。\n\n后台运行模式\n\n使用--web-bg参数可以让仪表盘在后台运行，打印URL后退出。之后可以使用conductor stop命令终止工作流。这一模式适合长时间运行的任务，用户无需保持终端开启。\n\n典型使用示例\n\n简单问答工作流\n\nyaml\nworkflow:\n name: simple-qa\n description: A simple question-answering workflow\n entry_point: answerer\n\nagents:\n - name: answerer\n model: gpt-5.2\n prompt: |\n Answer the following question:\n {{ workflow.input.question }}\n output:\n answer:\n type: string\n routes:\n - to: $end\n\noutput:\n answer: \"{{ answerer.output.answer }}\"\n\n\n执行命令：conductor run my-workflow.yaml --input question="What is Python?"\n\n设计评审工作流（含人机协作）\n\n这个示例展示了如何在设计评审流程中引入人工决策点：\n\n1. 初始代理生成设计文档\n2. 评审代理检查设计并提出修改建议\n3. 人机协作节点询问是否接受修改建议\n4. 如果接受，返回步骤1迭代改进；如果拒绝，进入最终输出\n\n这种模式确保了AI辅助不会取代人类判断，而是在关键节点提供建议并等待确认。\n\n脚本步骤与条件路由\n\nConductor还支持纯脚本步骤，无需AI代理参与。例如，可以在工作流中插入shell命令检查磁盘空间，然后根据退出码决定是继续执行还是报错终止。\n\nyaml\nagents:\n - name: check_disk\n type: script\n command: \"df -h / | awk 'NR==2 {print $5}' | sed 's/%//'\"\n routes:\n - condition: \"{{ output.exit_code == 0 and output.stdout | int < 90 }}\"\n to: next_step\n - condition: \"{{ output.stdout | int >= 90 }}\"\n to: cleanup_step\n\n\n与同类工具的对比\n\n| 特性 | Conductor | LangGraph | AutoGen | CrewAI |\n|------|-----------|-----------|---------|--------|\n| 配置方式 | YAML | Python代码 | Python代码 | Python代码 |\n| 人机协作 | 内置 | 需自定义 | 需自定义 | 有限支持 |\n| Web仪表盘 | 内置 | 需额外配置 | 无 | 无 |\n| 多提供商 | Copilot/Claude | 任意 | 任意 | 任意 |\n| 并行执行 | 原生支持 | 支持 | 支持 | 支持 |\n| 安全限制 | 内置 | 需自定义 | 需自定义 | 需自定义 |\n\nConductor的优势在于其声明式配置和开箱即用的生产级功能，特别适合希望快速搭建稳定工作流而不想编写大量样板代码的团队。\n\n技术实现与生态\n\nConductor基于Python 3.12+开发，使用uv进行依赖管理。项目采用模块化架构，核心组件包括：\n\n- 工作流解析器：将YAML转换为内部执行图\n- 代理调度器：管理Copilot CLI或Claude API的调用\n- 状态管理器：持久化工作流执行状态\n- Web服务器：为仪表盘提供实时数据流\n\n项目遵循微软开源行为准则，采用MIT许可证，欢迎社区贡献。目前已包含7个完整示例工作流，涵盖从简单问答到复杂并行处理的多种场景。\n\n适用场景与部署建议\n\n最佳适用场景\n\n1. 内容审核流水线：需要多轮评估和人工确认的内容发布流程\n2. 代码审查自动化：并行运行多个检查代理，汇总结果后人工决策\n3. 研究助理工作流：多维度信息收集、交叉验证、报告生成\n4. 客户服务分诊：根据查询类型路由到不同专业代理\n\n部署注意事项\n\n对于生产环境部署，建议：\n\n- 使用--log-file参数记录完整执行日志，便于审计和故障排查\n- 为长时间运行的工作流设置合理的超时值\n- 利用--dry-run预览执行计划，避免意外资源消耗\n- 对于敏感数据，优先使用本地Claude部署而非云端API\n\n总结与展望\n\nMicrosoft Conductor代表了一种务实的多智能体工作流构建方式。它不追求覆盖所有可能的AI交互模式，而是专注于提供一套稳定、可维护、生产就绪的基础功能。YAML配置方式降低了使用门槛，内置的安全机制和Web仪表盘则确保了工作流的可控性和可观测性。\n\n随着AI Agent生态的成熟，像Conductor这样的编排工具将变得越来越重要。它让开发者可以专注于业务逻辑而非基础设施，是构建可靠AI应用的重要基础设施组件。

Microsoft Conductor：用YAML编排多智能体工作流的CLI工具

导读 / 主楼：Microsoft Conductor：用YAML编排多智能体工作流的CLI工具

背景

补充观点 1

继续阅读

Splinter：一款无锁零拷贝的共享内存 KV 与向量存储库，让 LLM 推理告别 socket 与 memcpy 开销

Folkering OS：当操作系统本身就是 AI——一个能自我进化的裸机 Rust 系统

LLM-assisted-analysis：用大模型检测智能合约逻辑漏洞的新思路

AI图像生成技术全景：商业API、开源模型与开发者工具完全指南