正文

Agent Cooking CLI：为AI Agent打造证据优先的工作流框架

本文介绍了一款创新的CLI工具，它通过建立结构化的工作空间和可审计的证据系统，帮助AI Agent实现无需依赖对话记忆的可靠决策流程。

AI Agent工作流证据优先CLI工具可审计性人机协作

发布时间 2026/05/07 12:44最近活动 2026/05/07 12:49预计阅读 4 分钟

章节 01

导读 / 主楼：Agent Cooking CLI：为AI Agent打造证据优先的工作流框架

本文介绍了一款创新的CLI工具，它通过建立结构化的工作空间和可审计的证据系统，帮助AI Agent实现无需依赖对话记忆的可靠决策流程。

章节 02

引言：AI Agent的记忆困境

随着大语言模型能力的不断提升，AI Agent（智能代理）正在从简单的对话助手演变为能够执行复杂任务的自主系统。然而，一个根本性的挑战始终存在：Agent如何在没有持续对话上下文的情况下保持工作的连贯性和可追溯性？

传统的Agent实现高度依赖于对话历史（chat memory），这意味着一旦会话中断或需要跨会话协作，Agent就可能丢失重要的上下文信息。此外，当需要审计Agent的决策过程时，对话记录往往难以提供结构化的证据链。

Agent Cooking CLI项目正是为解决这些问题而诞生的。它提出了一种全新的"证据优先"（Evidence-first）工作流范式，通过建立持久化的工作空间和严格的证据管理规范，让Agent能够像人类专家一样进行系统化的问题分析和决策。

章节 03

什么是证据优先工作流？

证据优先工作流的核心原则是：每一个结论都必须有对应的证据支持。这与传统的AI Agent工作方式形成鲜明对比——后者往往依赖于模型的内部知识生成答案，而缺乏外部验证机制。

在证据优先的框架下，Agent的工作流程被严格规范为：

收集证据：从各种来源（日志文件、数据库、API响应等）提取原始信息
建立事实：基于证据提炼出客观事实，每个事实都必须引用具体的证据ID
形成假设：在事实基础上提出可能的解释或假设，同样需要证据支持
确定方向：基于假设制定行动方案，确保决策的可追溯性

章节 04

为什么需要摆脱对话记忆？

依赖对话记忆的工作方式存在几个固有缺陷：

脆弱性：会话中断意味着上下文丢失
不可审计：对话历史难以提供结构化的决策依据
难以协作：多个Agent或人类难以共享基于对话的工作状态
规模限制：长对话可能导致上下文窗口溢出

通过将工作状态持久化到文件系统，Agent Cooking CLI实现了真正的状态持久性，使得Agent可以在任意时间点恢复工作，并支持多人多Agent协作。

章节 05

工作空间结构

Agent Cooking CLI创建的工作空间具有以下层次结构：

triage/
├── case.yaml          # 案例输入和上下文（事实，而非猜测）
├── evidence/          # 证据片段目录
│   ├── index.md       # 证据索引，包含EID（E001, E002等）
│   └── ...            # 原始证据文件
├── facts.md           # 提炼的事实（每个事实引用EID）
├── hypotheses.md      # 假设（必须引用EID）
└── directions.md      # 行动方向（必须引用EID）

这种结构确保了信息的层次化和可追溯性。从原始证据到最终决策，每一步都有清晰的引用链。

章节 06

严格的验证规则

系统强制执行一条铁律：没有证据支持的假设或方向无法成立。这一规则通过CLI工具的验证机制实现，确保工作空间的完整性和一致性。

章节 07

Profile系统

Agent Cooking CLI引入了"Profile"（配置文件）的概念，允许为不同类型的任务定义标准化的工作流程。例如：

嵌入式系统调试Profile：针对硬件故障排查优化的证据收集和假设形成流程
软件缺陷分析Profile：针对Bug诊断设计的结构化分析方法
产品设计Profile：支持产品决策的证据收集框架

用户可以通过简单的YAML文件定义自己的Profile，实现工作流的定制化。

章节 08

场景：嵌入式系统故障排查

假设一个嵌入式设备出现随机重启问题，传统的排查方式可能是直接在聊天界面中描述现象并询问可能原因。而在证据优先的框架下，流程如下：

创建工作空间：使用kitchen start --profile embedded_system_v1初始化项目
附加证据：将UART日志文件附加到证据目录，分配EID（如E001）
提取事实：从日志中提炼客观事实，如"设备在启动后30秒内发生看门狗复位（引用E001）"
形成假设：基于事实提出假设，如"可能是电源不稳定导致复位（引用E001）"
确定方向：制定下一步行动，如"测量电源纹波并检查去耦电容（引用E001）"
验证工作空间：运行验证命令确保所有引用有效

这一过程产生的所有信息都保存在文件系统中，可以随时回顾、分享或继续深入分析。

Agent Cooking CLI：为AI Agent打造证据优先的工作流框架

导读 / 主楼：Agent Cooking CLI：为AI Agent打造证据优先的工作流框架

引言：AI Agent的记忆困境

什么是证据优先工作流？

为什么需要摆脱对话记忆？

工作空间结构

严格的验证规则

Profile系统

场景：嵌入式系统故障排查

继续阅读

Nornir MCP Server：将大语言模型引入网络自动化的企业级桥梁

Bibliothèque Française LLM：为大型语言模型优化的法语公版文献索引系统

Splinter：一款无锁零拷贝的共享内存 KV 与向量存储库，让 LLM 推理告别 socket 与 memcpy 开销

Folkering OS：当操作系统本身就是 AI——一个能自我进化的裸机 Rust 系统