正文

retention.sh：AI编程代理的始终在线工作流裁判系统

一个为AI编码代理设计的质量保障系统，通过四个始终在线的钩子（会话恢复、工作流检测、工具追踪、完成拦截）来捕获遗漏步骤、验证执行质量，并支持工作流回放以降低成本。

AI agentworkflowQAquality assurancereplaycost optimizationOpenAIAnthropicLangChainCrewAI

发布时间 2026/04/10 07:40最近活动 2026/04/10 07:46预计阅读 3 分钟

章节 01

retention.sh：AI编程代理的始终在线工作流裁判系统（导读）

retention.sh是一款为AI编码代理设计的质量保障系统，旨在解决AI代理"自信犯错"的问题（如跳过测试、遗漏步骤）。它通过四大始终在线钩子（会话恢复、工作流检测、工具追踪、完成拦截）捕获遗漏步骤、验证执行质量，并支持工作流回放以降低60-70%的成本。核心定位是"始终在线的工作流裁判"，提供硬性裁决（PASS/FAIL/BLOCKED），而非简单日志工具。

章节 02

项目背景：AI代理的可靠性困境与核心定位

随着Claude Code、Cursor Composer等AI编程代理普及，开发者面临代理"自信犯错"的问题——声称任务完成却跳过测试、遗漏关键步骤或忽略上下文。retention.sh应运而生，作为"始终在线的工作流裁判"，系统化捕获遗漏步骤并提前拦截问题。其核心理念是：展示代理跳过的测试、遗忘的步骤和缺失的上下文，阻止问题再次发生，提供明确的质量裁决。

章节 03

三大核心功能与四大钩子机制

核心功能：1.质量检查：追踪执行过程，识别步骤完成/遗漏情况，输出硬性裁决；2.工作流回放：捕获昂贵执行并以60-70%低成本回放，通过严格裁判验证有效性；3.完整追踪：记录工具调用的截图、证据、成本分析，生成可共享链接。

四大钩子：on-session-start（恢复未完成工作）、on-prompt（检测工作流类型并注入必需步骤）、on-tool-use（追踪工具调用，提示缺失步骤）、on-stop（拦截未完成任务的"完成"声明）。

章节 04

多平台SDK支持与隐私保护

retention.sh提供广泛SDK集成，支持OpenAI、Anthropic、LangChain、CrewAI等主流AI代理框架，一行代码即可启用（如track()自动检测或指定provider）。

隐私方面，系统自动清理敏感数据（API密钥、密码等），生成结构化事件记录，默认存储于本地~/.retention/activity.jsonl，确保遥测数据不泄露机密。

章节 05

实际效果数据与团队协作

效果数据：回放成本节省63-73%，裁判一致率89%，测试3个工作流家族后修正次数为0。

团队协作：通过团队代码机制（如创建团队获得代码K7XM2P，成员加入时使用RETENTION_TEAM环境变量）共享工作流记忆，建立团队统一质量标准。

章节 06

适用场景与快速安装

适用场景：1.工程师：解决代理跳过测试/搜索步骤问题，低成本回放重复工作流；2.团队负责人：了解代理实际执行情况、遗漏步骤及成本节省点；3.创始人：将重复AI工作转化为可复用运营杠杆。

安装：快速安装（curl -sL retention.sh/install.sh | bash）或pip安装（pip install retention），使用示例：retention.qa_check(url='http://localhost:3000')。

章节 07

结语：AI代理质量保障的重要创新

retention.sh是AI代理质量保障领域的重要创新，不仅提供判断能力（区别于传统日志工具），还通过回放实现显著成本优化。在AI代理向生产级基础设施演进中，此类监督验证机制将愈发重要。核心洞察：AI代理不仅需要更多能力，更需要更好的监督与验证机制，retention.sh正是这一机制的有力实现。