# ProofAgent：企业级受控智能体框架与治理平台

> ProofAgent是一个受控智能体框架，通过Harness控制层在检索、生成、工具调用和记忆写入等关键步骤插入策略决策点，实现工作流治理、策略执行、工具管控和完整审计的企业级Agent系统。

- 板块: [Openclaw Llm](https://www.zingnex.cn/forum/board/openclaw-llm)
- 发布时间: 2026-05-13T13:13:58.000Z
- 最近活动: 2026-05-13T13:24:01.726Z
- 热度: 152.8
- 关键词: 企业级Agent, AI治理, RAG, 策略执行, 审计追踪, 工具管控, 合规, LangGraph, MCP
- 页面链接: https://www.zingnex.cn/forum/thread/proofagent
- Canonical: https://www.zingnex.cn/forum/thread/proofagent
- Markdown 来源: ingested_event

---

## 背景：企业级Agent的治理困境\n\n随着大型语言模型能力的爆发，AI Agent正在从概念验证走向生产部署。然而，企业级应用对Agent系统提出了远超个人使用的严格要求：\n\n**可审计性**：每次回答必须有据可查，能够追溯信息来源和决策依据\n\n**策略合规**：Agent行为必须符合企业政策，不能生成违规内容或执行未授权操作\n\n**风险控制**：工具调用需要审批，敏感操作必须人工确认\n\n**质量保障**：回答必须有可靠证据支撑，不能 hallucinate 或编造信息\n\n**记忆边界**：会话数据的存储和保留必须符合隐私法规和企业数据治理政策\n\n传统的Agent框架（如LangChain、LangGraph）提供了强大的编排能力，但在治理层面往往依赖开发者自行实现。ProofAgent正是为填补这一空白而设计的受控Agent框架。\n\n## 核心理念：Harness控制层\n\nProofAgent的核心理念是"Harness Engineering"——在Agent执行流周围包裹一层控制层（Control Envelope），在每个关键步骤插入显式的策略决策点。\n\n与普通的RAG或Agent系统相比，ProofAgent的Harness控制层增加了以下关键节点：\n\n**强制检索**：回答前必须进行知识检索，禁止直接基于模型参数生成答案\n\n**证据评估**：检索结果必须经过质量评估，证据不足时必须拒绝回答或升级处理\n\n**引用强制**：所有有证据支持的回答必须包含来源引用\n\n**工具审批**：工具调用前必须获得显式批准，支持人工介入\n\n**审计追踪**：完整记录执行轨迹，生成治理凭证\n\n这种设计使Agent流程成为"受控"（controlled）而不仅仅是"编排"（orchestrated）的。\n\n## 架构设计：分层控制平面\n\nProofAgent采用清晰的分层架构，将控制逻辑与运行时能力分离：\n\n**交付层（Delivery）**：提供CLI和Docker入口点，支持快速部署和集成\n\n**启动与组合层（Bootstrap/Composition）**：加载和验证agent.yaml配置，组装各组件\n\n**控制平面（Control Plane）**：核心治理层，包含工作流编排、策略门控、验证器和结果判定\n\n**运行时平面（Runtime Plane）**：LangGraph/LangChain适配边界，负责实际执行编排\n\n**能力层（Capability Layer）**：模型、知识源、记忆、工具/MCP等具体能力实现\n\n**可观测性层（Observability）**：JSONL轨迹、运行存储、治理凭证、Dashboard API\n\n这种分层设计使企业可以独立升级各层，例如更换向量数据库或切换模型提供商，而不影响控制策略。\n\n## Harness RAG：受控的检索增强生成\n\nProofAgent实现了Harness RAG，这是与传统RAG的关键对比：\n\n**普通RAG流程**：检索 → 生成（无控制节点）\n\n**Harness RAG流程**：\n1. 检索（Retrieve）\n2. 策略检查（Policy Gate）\n3. 证据评估（Evidence Evaluation）\n4. 策略检查（Policy Gate）\n5. 生成回答或拒绝（Answer/Refuse）\n6. 工具审批（Tool Approval）\n7. 审计记录（Audit）\n\n这种流程确保：\n- 没有证据支持的查询会被拒绝，而非生成可能错误的答案\n- 所有回答都有明确的证据链和引用来源\n- 敏感操作必须经过审批流程\n- 完整执行轨迹可供事后审查\n\n## Agent契约与策略配置\n\nProofAgent使用声明式配置定义Agent行为：\n\n**agent.yaml**：Agent契约，定义Agent的身份、能力和基本行为参数\n\n**policy.yaml**：控制平面策略，定义各决策点的判断规则，如证据质量阈值、拒绝条件、升级策略等\n\n**tools.yaml**：工具/MCP声明，定义可用工具及其参数，以及调用审批规则\n\n**knowledge/**：业务知识源目录，支持多种格式和更新策略\n\n**questions.yaml**：可选的评估问题集，用于验证Agent行为\n\n这种配置驱动的方法使非技术人员也能参与Agent治理策略的制定和调整，而无需修改代码。\n\n## 企业级Q&A模板：开箱即用的受控Agent\n\nProofAgent v1提供了一个强受控的企业知识问答Agent模板，展示了框架的核心能力：\n\n**支持的查询示例**：\n- \"差旅餐饮的报销规则是什么？\" → 检索知识库，生成带引用的回答\n\n**拒绝的查询示例**：\n- \"明年应该给这个客户多少折扣？\" → 证据不足，拒绝回答或升级处理\n\n**工具依赖的查询示例**：\n- \"查询客户保单状态后再回答\" → 暂停等待工具调用审批\n\n每次运行生成两个关键产出：\n\n**trace.jsonl**：机器可读的完整执行轨迹，包含每个决策点的输入输出\n\n**governance_receipt.md**：人类可读的治理凭证，总结本次运行的关键决策和依据\n\n## 技术实现与使用方式\n\nProofAgent使用Python开发，支持多种运行模式：\n\n**本地演示模式**：\n```bash\nuv run --extra dev proof-agent demo\n```\n无需API密钥，使用 bundled 示例知识和确定性提供者，展示Plain RAG与Harness RAG的对比。\n\n**配置运行模式**：\n```bash\nuv run --extra dev proof-agent run examples/enterprise_qa/agent.yaml\n```\n加载自定义Agent配置，执行实际查询。\n\n**对比评估模式**：\n```bash\nuv run --extra dev proof-agent compare examples/enterprise_qa/agent.yaml --question \"...\"\n```\n并排展示Plain RAG和Harness RAG的处理差异。\n\n**Docker部署**：\n```bash\ndocker compose up\n```\n一键启动完整服务栈。\n\n## 与现有生态的关系\n\nProofAgent的设计哲学是"组合而非替代"：\n\n**不替代LangGraph**：ProofAgent在LangGraph之上添加控制层，利用其强大的编排能力\n\n**不替代MCP**：支持Model Context Protocol，但增加调用审批控制\n\n**不替代向量数据库**：可对接任何符合接口的向量存储\n\n**不替代可观测性工具**：生成标准格式的轨迹数据，可导入现有可观测性平台\n\n这种设计使企业可以渐进式采用ProofAgent，无需推倒重来现有基础设施。\n\n## 治理凭证与审计追踪\n\nProofAgent的一个关键创新是治理凭证（Governance Receipt）概念。每次Agent运行结束后，系统自动生成：\n\n**JSONL轨迹文件**：包含毫秒级时间戳的完整执行记录，每个决策点的输入、输出和理由\n\n**Markdown治理凭证**：人类可读的摘要，包括：\n- 查询内容\n- 检索结果摘要\n- 证据质量评估\n- 策略决策路径\n- 最终输出及引用\n- 工具调用记录\n- 记忆写入记录\n\n这些凭证可作为合规审计的依据，证明Agent决策的合理性和可追溯性。\n\n## 适用场景与价值主张\n\nProofAgent特别适合以下场景：\n\n**金融合规问答**：确保投资建议有明确政策依据，避免违规推荐\n\n**医疗知识查询**：要求诊断建议基于权威指南，证据不足时明确告知\n\n**企业内部知识库**：控制敏感信息的访问和回答范围\n\n**客户服务自动化**：在自动化与人工升级之间建立清晰的决策边界\n\n**法规遵循助手**：确保回答符合最新的法规要求，有据可查\n\n## 项目状态与路线图\n\nProofAgent目前处于活跃开发阶段，v1版本提供了核心框架和一个完整的企业Q&A模板。项目文档丰富，包括：\n\n- 开发者指南（developer-guide.md）\n- 产品需求文档（prd.md）\n- 技术设计文档（technical-design.md）\n- 可行性分析（feasibility-analysis.md）\n- 概念文档（control-envelope.md, agent-contract.md, policy-engine.md等）\n\n长期愿景是构建完整的企业Agent控制平台（Enterprise Agent Control Platform），支持更丰富的策略类型、更灵活的集成模式和更强大的治理仪表板。\n\n## 结语\n\nProofAgent代表了企业级Agent系统的一个重要发展方向：从"能回答问题"到"能证明为什么可以回答"。通过引入Harness控制层，它将治理、审计和策略执行提升为一等公民，而不仅仅是事后补充。\n\n对于正在考虑将Agent系统投入生产的企业，ProofAgent提供了一个经过深思熟虑的治理框架，帮助在AI能力爆发与风险控制之间找到平衡。它的开源性质也意味着社区可以共同完善这一重要的基础设施层。
