Zing 论坛

正文

Datasynx Shadowing:AI 驱动的自动化 SOP 生成工具

一款本地优先的 CLI 工具,通过静默观察员工工作流程自动生成标准化的操作程序文档,支持 PII 脱敏和 MCP 原生集成

SOP知识管理ClaudeMCP本地优先PII脱敏工作流自动化企业文档
发布时间 2026/06/11 04:45最近活动 2026/06/11 04:53预计阅读 8 分钟
Datasynx Shadowing:AI 驱动的自动化 SOP 生成工具
1

章节 01

导读 / 主楼:Datasynx Shadowing:AI 驱动的自动化 SOP 生成工具

一款本地优先的 CLI 工具,通过静默观察员工工作流程自动生成标准化的操作程序文档,支持 PII 脱敏和 MCP 原生集成

3

章节 03

补充观点 1

原作者与来源

  • 原作者/维护者:datasynx
  • 来源平台:github
  • 原始标题:agentic-ai-shadowing
  • 原始链接:https://github.com/datasynx/agentic-ai-shadowing
  • 来源发布时间/更新时间:2026-06-10T20:45:27Z 原作者与来源\n\n- 原作者/维护者: datasynx\n- 来源平台: GitHub\n- 原项目名: agentic-ai-shadowing\n- 原始链接: https://github.com/datasynx/agentic-ai-shadowing\n- 发布时间: 2026年6月\n\n---\n\n项目概述\n\nDatasynx Shadowing 是一款创新的本地优先 CLI 工具,它像一个"静默的影子"一样观察员工的日常工作流程——从 shell 命令到活跃窗口,从 git 提交到文件变更——然后利用 Claude AI 自动生成结构化的标准操作程序(SOP)。\n\n这个项目的口号是"你的团队永远没时间写的 SOP"。它直击企业知识管理中的一个核心痛点:关键业务流程往往只存在于资深员工的头脑中,一旦人员流动,这些知识就随之流失。\n\n---\n\n核心功能与工作流程\n\n1. 主动任务模式\n\n员工可以主动启动一个任务记录会话:\n\n\n$ shadowing start\n\n Agentic AI Shadowing — Active\n\n? Start a new task? Yes\n? Task title: Monthly SAP Closing\n? Short description: Monthly closing tasks in SAP FI\n\n Task started: \"Monthly SAP Closing\" (ID: a3f8c210)\n\n\n在任务进行期间,工具会静默记录用户的操作。任务完成后,Claude 会自动生成包含目标、前置条件、步骤和预期结果的完整 SOP。\n\n2. 自动观察模式\n\n更强大的功能是自动观察模式:\n\n\n$ shadowing observe --auto-sop\n\n Observation started (Session: b7e2f4a1)\n Sources: Windows · Shell History · Git\n Auto-SOP: enabled\n\n [14:23:01] Window VS Code — src/api/routes.ts\n [14:23:45] Shell git diff src/api/routes.ts\n [14:24:12] Shell npm run test\n [14:35:22] Shell git commit -m \"fix: validate input\"\n [14:35:30] Shell git push origin feature/validation\n\n Observation ended. 2 tasks detected → 2 SOPs generated.\n\n\n系统能够智能识别任务边界,自动将连续的操作序列分割成独立的 SOP。\n\n---\n\n技术架构设计\n\n本地优先原则\n\nShadowing 的核心架构决策是"本地优先":\n\n- 数据存储: 本地 SQLite 数据库(使用 WAL 模式),而非云端服务\n- 无后台守护进程: 不常驻内存,只在用户主动调用时运行\n- 无遥测: 不向厂商发送使用统计或诊断数据\n- 唯一外部调用: 仅调用 Claude API 进行 SOP 生成\n\n这种设计对于处理敏感业务数据的企业至关重要——数据不会离开员工的机器,除非显式导出。\n\nPII 脱敏系统\n\n导出功能内置了多层 PII(个人身份信息)脱敏机制:\n\n| 数据类型 | 处理方式 |\n|---------|---------|\n| 邮箱地址 | 自动识别并替换为占位符 |\n| IP 地址 | 脱敏处理 |\n| URL | 域名和路径脱敏 |\n| 电话号码 | 格式识别并替换 |\n| 文件路径 | 路径组件匿名化 |\n| IBAN/信用卡 | 始终开启的专项脱敏 |\n| 税号/社保号 | 模式匹配并脱敏 |\n\n用户可以在导出前预览脱敏效果,确保敏感信息不会泄露到共享文档中。\n\nMCP 原生集成\n\nShadowing 不是简单地将 MCP 作为附加功能,而是从一开始就作为 MCP 服务器设计:\n\n- 17 个类型化工具: 提供完整的类型安全接口\n- Claude Code 集成: 支持 hook 处理器,实现无缝 IDE 集成\n- 多代理支持: 兼容 Claude Code、Codex、Cursor 等主流 AI 编程工具\n\n这意味着开发者可以直接在 IDE 中通过自然语言指令驱动 Shadowing,例如"记录我当前正在进行的部署流程"。\n\n---\n\n质量度量体系\n\nShadowing 引入了一套独特的 SOP 质量评分系统:\n\n1. 一致性评分 (Consistency)\n\n衡量同一任务多次执行时 SOP 的稳定程度。如果同一任务生成的 SOP 差异很大,说明流程本身可能不够标准化。\n\n2. 成熟度评分 (Maturity)\n\n基于 SOP 的完整性、步骤清晰度、前置条件明确度等因素评估。\n\n3. 新鲜度评分 (Freshness)\n\n追踪 SOP 的最后更新时间。长时间未更新的 SOP 会被标记为可能过时。\n\n4. 综合评分\n\n综合以上三个维度,给出整体可信度评估。这帮助团队识别哪些 SOP 值得信赖,哪些需要重新审查。\n\n---\n\n企业级功能\n\nWeb 仪表板\n\n项目包含一个深色主题的企业级 Web 仪表板,提供:\n\n- SOP 编辑器:支持实时编辑和版本对比\n- 质量指标可视化:图表展示 SOP 库的健康状况\n- Diff 查看器:直观展示 SOP 版本间的差异\n- 导出工作流:支持批量导出和自定义脱敏规则\n\n版本历史\n\n每个 SOP 的每次变更都被完整记录,支持:\n- 时间线浏览\n- 版本对比\n- 回滚到任意版本\n- 变更作者追踪\n\n---\n\n对比传统方案的优势\n\n| 传统方式 | Shadowing 方案 |\n|---------|---------------|\n| SOP 依赖记忆事后编写,经常遗漏细节 | 实时捕获操作过程,自动生成完整文档 |\n| 关键知识随人员离职而流失 | 每个重复性任务都变成可版本化、可审查的 SOP |\n| 监控 SaaS 将屏幕活动上传到第三方云 | 100% 本地运行,数据不出员工机器 |\n| 导出文档泄露邮箱、IP、文件路径等敏感信息 | 自动 PII 脱敏,导出前可预览 |\n| "这个 SOP 还准确吗?"——无人知晓 | 一致性、成熟度、新鲜度评分自动标记过时文档 |\n| 需要切换到单独工具更新程序 | 通过 MCP 直接在 IDE 中驱动,不中断工作流 |\n\n---\n\n实际应用场景\n\n场景一:新员工培训\n\n资深员工执行一次"月末结账"流程,Shadowing 自动生成详细 SOP。新员工可以按图索骥,大幅减少培训时间和错误率。\n\n场景二:关键岗位备份\n\n对于只有一两个人掌握的关键业务流程(如特定系统的管理员操作),Shadowing 确保知识被文档化,降低人员风险。\n\n场景三:流程优化基准\n\n通过对比不同员工执行同一任务的 SOP,识别最佳实践和流程差异,为标准化改进提供数据支持。\n\n场景四:合规审计支持\n\n自动生成的操作日志和 SOP 可以作为合规审计的证据,证明关键流程有明确的执行标准。\n\n---\n\n技术栈与工程实践\n\n- TypeScript: 严格类型检查,ESM-only\n- SQLite: WAL 模式,本地数据存储\n- Vitest: 1112+ 测试用例\n- CI/CD: GitHub Actions 自动化\n- 文档: 完整文档站点\n- 许可证: MIT 开源\n\n---\n\n隐私与伦理考量\n\nShadowing 在设计上就考虑了隐私和伦理问题:\n\n1. 员工驱动: 员工主动启动、暂停和完成任务,不会未经同意记录\n2. 排除规则: 支持配置排除特定应用或操作类型\n3. 本地处理: 敏感数据处理在本地完成,不上传云端\n4. 透明脱敏: 导出前可预览脱敏效果,确保符合公司政策\n\n这种设计平衡了知识捕获的需求与员工隐私的保护。\n\n---\n\n总结与思考\n\nDatasynx Shadowing 代表了一种新的知识管理范式:从"让人写文档"到"让 AI 观察并生成文档"。\n\n它的核心洞察是:最好的文档是在工作发生时自动生成的,而不是事后回忆编写的。人类不擅长在完成任务后再详细回忆每个步骤,而 AI 可以无遗漏地记录和分析。\n\n这个项目的成功关键在于几个设计决策:\n\n1. 本地优先: 消除了企业对数据安全的顾虑\n2. MCP 原生: 无缝集成到开发者现有工作流\n3. 质量评分: 不仅生成文档,还评估文档质量\n4. PII 脱敏: 解决了企业级部署的最大障碍\n\n对于希望建立知识管理体系但又苦于"没人愿意写文档"困境的团队,Shadowing 提供了一个务实的解决方案。它不是要取代人类的判断,而是将人类从繁琐的文档工作中解放出来,专注于更有价值的任务。