Zing 论坛

正文

Agent Cooking CLI:为AI Agent打造证据优先的工作流框架

本文介绍了一款创新的CLI工具,它通过建立结构化的工作空间和可审计的证据系统,帮助AI Agent实现无需依赖对话记忆的可靠决策流程。

AI Agent工作流证据优先CLI工具可审计性人机协作
发布时间 2026/05/07 12:44最近活动 2026/05/07 12:49预计阅读 4 分钟
Agent Cooking CLI:为AI Agent打造证据优先的工作流框架
1

章节 01

导读 / 主楼:Agent Cooking CLI:为AI Agent打造证据优先的工作流框架

本文介绍了一款创新的CLI工具,它通过建立结构化的工作空间和可审计的证据系统,帮助AI Agent实现无需依赖对话记忆的可靠决策流程。

2

章节 02

引言:AI Agent的记忆困境

随着大语言模型能力的不断提升,AI Agent(智能代理)正在从简单的对话助手演变为能够执行复杂任务的自主系统。然而,一个根本性的挑战始终存在:Agent如何在没有持续对话上下文的情况下保持工作的连贯性和可追溯性?

传统的Agent实现高度依赖于对话历史(chat memory),这意味着一旦会话中断或需要跨会话协作,Agent就可能丢失重要的上下文信息。此外,当需要审计Agent的决策过程时,对话记录往往难以提供结构化的证据链。

Agent Cooking CLI项目正是为解决这些问题而诞生的。它提出了一种全新的"证据优先"(Evidence-first)工作流范式,通过建立持久化的工作空间和严格的证据管理规范,让Agent能够像人类专家一样进行系统化的问题分析和决策。

3

章节 03

什么是证据优先工作流?

证据优先工作流的核心原则是:每一个结论都必须有对应的证据支持。这与传统的AI Agent工作方式形成鲜明对比——后者往往依赖于模型的内部知识生成答案,而缺乏外部验证机制。

在证据优先的框架下,Agent的工作流程被严格规范为:

  1. 收集证据:从各种来源(日志文件、数据库、API响应等)提取原始信息
  2. 建立事实:基于证据提炼出客观事实,每个事实都必须引用具体的证据ID
  3. 形成假设:在事实基础上提出可能的解释或假设,同样需要证据支持
  4. 确定方向:基于假设制定行动方案,确保决策的可追溯性
4

章节 04

为什么需要摆脱对话记忆?

依赖对话记忆的工作方式存在几个固有缺陷:

  • 脆弱性:会话中断意味着上下文丢失
  • 不可审计:对话历史难以提供结构化的决策依据
  • 难以协作:多个Agent或人类难以共享基于对话的工作状态
  • 规模限制:长对话可能导致上下文窗口溢出

通过将工作状态持久化到文件系统,Agent Cooking CLI实现了真正的状态持久性,使得Agent可以在任意时间点恢复工作,并支持多人多Agent协作。

5

章节 05

工作空间结构

Agent Cooking CLI创建的工作空间具有以下层次结构:

triage/
├── case.yaml          # 案例输入和上下文(事实,而非猜测)
├── evidence/          # 证据片段目录
│   ├── index.md       # 证据索引,包含EID(E001, E002等)
│   └── ...            # 原始证据文件
├── facts.md           # 提炼的事实(每个事实引用EID)
├── hypotheses.md      # 假设(必须引用EID)
└── directions.md      # 行动方向(必须引用EID)

这种结构确保了信息的层次化和可追溯性。从原始证据到最终决策,每一步都有清晰的引用链。

6

章节 06

严格的验证规则

系统强制执行一条铁律:没有证据支持的假设或方向无法成立。这一规则通过CLI工具的验证机制实现,确保工作空间的完整性和一致性。

7

章节 07

Profile系统

Agent Cooking CLI引入了"Profile"(配置文件)的概念,允许为不同类型的任务定义标准化的工作流程。例如:

  • 嵌入式系统调试Profile:针对硬件故障排查优化的证据收集和假设形成流程
  • 软件缺陷分析Profile:针对Bug诊断设计的结构化分析方法
  • 产品设计Profile:支持产品决策的证据收集框架

用户可以通过简单的YAML文件定义自己的Profile,实现工作流的定制化。

8

章节 08

场景:嵌入式系统故障排查

假设一个嵌入式设备出现随机重启问题,传统的排查方式可能是直接在聊天界面中描述现象并询问可能原因。而在证据优先的框架下,流程如下:

  1. 创建工作空间:使用kitchen start --profile embedded_system_v1初始化项目
  2. 附加证据:将UART日志文件附加到证据目录,分配EID(如E001)
  3. 提取事实:从日志中提炼客观事实,如"设备在启动后30秒内发生看门狗复位(引用E001)"
  4. 形成假设:基于事实提出假设,如"可能是电源不稳定导致复位(引用E001)"
  5. 确定方向:制定下一步行动,如"测量电源纹波并检查去耦电容(引用E001)"
  6. 验证工作空间:运行验证命令确保所有引用有效

这一过程产生的所有信息都保存在文件系统中,可以随时回顾、分享或继续深入分析。