章节 01
retention.sh:AI编程代理的始终在线工作流裁判系统(导读)
retention.sh是一款为AI编码代理设计的质量保障系统,旨在解决AI代理"自信犯错"的问题(如跳过测试、遗漏步骤)。它通过四大始终在线钩子(会话恢复、工作流检测、工具追踪、完成拦截)捕获遗漏步骤、验证执行质量,并支持工作流回放以降低60-70%的成本。核心定位是"始终在线的工作流裁判",提供硬性裁决(PASS/FAIL/BLOCKED),而非简单日志工具。
正文
一个为AI编码代理设计的质量保障系统,通过四个始终在线的钩子(会话恢复、工作流检测、工具追踪、完成拦截)来捕获遗漏步骤、验证执行质量,并支持工作流回放以降低成本。
章节 01
retention.sh是一款为AI编码代理设计的质量保障系统,旨在解决AI代理"自信犯错"的问题(如跳过测试、遗漏步骤)。它通过四大始终在线钩子(会话恢复、工作流检测、工具追踪、完成拦截)捕获遗漏步骤、验证执行质量,并支持工作流回放以降低60-70%的成本。核心定位是"始终在线的工作流裁判",提供硬性裁决(PASS/FAIL/BLOCKED),而非简单日志工具。
章节 02
随着Claude Code、Cursor Composer等AI编程代理普及,开发者面临代理"自信犯错"的问题——声称任务完成却跳过测试、遗漏关键步骤或忽略上下文。retention.sh应运而生,作为"始终在线的工作流裁判",系统化捕获遗漏步骤并提前拦截问题。其核心理念是:展示代理跳过的测试、遗忘的步骤和缺失的上下文,阻止问题再次发生,提供明确的质量裁决。
章节 03
核心功能:1.质量检查:追踪执行过程,识别步骤完成/遗漏情况,输出硬性裁决;2.工作流回放:捕获昂贵执行并以60-70%低成本回放,通过严格裁判验证有效性;3.完整追踪:记录工具调用的截图、证据、成本分析,生成可共享链接。
四大钩子:on-session-start(恢复未完成工作)、on-prompt(检测工作流类型并注入必需步骤)、on-tool-use(追踪工具调用,提示缺失步骤)、on-stop(拦截未完成任务的"完成"声明)。
章节 04
retention.sh提供广泛SDK集成,支持OpenAI、Anthropic、LangChain、CrewAI等主流AI代理框架,一行代码即可启用(如track()自动检测或指定provider)。
隐私方面,系统自动清理敏感数据(API密钥、密码等),生成结构化事件记录,默认存储于本地~/.retention/activity.jsonl,确保遥测数据不泄露机密。
章节 05
效果数据:回放成本节省63-73%,裁判一致率89%,测试3个工作流家族后修正次数为0。
团队协作:通过团队代码机制(如创建团队获得代码K7XM2P,成员加入时使用RETENTION_TEAM环境变量)共享工作流记忆,建立团队统一质量标准。
章节 06
适用场景:1.工程师:解决代理跳过测试/搜索步骤问题,低成本回放重复工作流;2.团队负责人:了解代理实际执行情况、遗漏步骤及成本节省点;3.创始人:将重复AI工作转化为可复用运营杠杆。
安装:快速安装(curl -sL retention.sh/install.sh | bash)或pip安装(pip install retention),使用示例:retention.qa_check(url='http://localhost:3000')。
章节 07
retention.sh是AI代理质量保障领域的重要创新,不仅提供判断能力(区别于传统日志工具),还通过回放实现显著成本优化。在AI代理向生产级基础设施演进中,此类监督验证机制将愈发重要。核心洞察:AI代理不仅需要更多能力,更需要更好的监督与验证机制,retention.sh正是这一机制的有力实现。