Zing 论坛

正文

AgentGuard:为AI代理钱包构建可编程安全防火墙

深入解析AgentGuard项目,了解如何通过Somnia Agents的共识验证机制,为自主AI钱包建立链上安全层,实现资金操作的事前审查与风险控制。

AI代理区块链安全智能合约SomniaLLM共识验证加密钱包DeFi风险控制Web3
发布时间 2026/06/10 19:43最近活动 2026/06/10 19:51预计阅读 3 分钟
AgentGuard:为AI代理钱包构建可编程安全防火墙
1

章节 01

AgentGuard:AI代理钱包的可编程安全防火墙

AgentGuard项目旨在为自主AI钱包构建链上可编程安全层,通过Somnia Agents的共识验证机制实现资金操作的事前审查与风险控制,解决AI代理自主性带来的资金安全挑战。核心设计哲学为'代理提议,Somnia Agents审查,保险库强制执行',结合'人在回路'与'代码即法律'的范式,平衡AI自主性与安全护栏。

2

章节 02

背景:AI代理资金安全的新挑战

随着LLM能力提升,AI代理逐渐具备管理加密钱包、执行交易等自主权限,但也带来安全隐患:提示注入攻击、模型幻觉、工具调用错误或私钥泄露可能导致资金被盗。传统依赖AI自身判断的安全模型已不足,AgentGuard因此诞生,在AI意图与资金转移间插入审查关卡。

3

章节 03

核心架构:三层防护安全模型

AgentGuard采用三层防护设计:

  1. AI代理层:代理不直接执行资金操作,仅通过proposeAction提交行动提案(含目标地址、金额、理由等),实现决策与执行分离。
  2. Somnia Agents审查层:核心创新,通过共识验证代理(使用Qwen3-30B等LLM)分析提案:先由Parse-Website Agent提取证据URL的安全信号,再由LLM Inference Agent做出APPROVE/REVIEW/BLOCK裁决,需严格多数共识生效。
  3. 保险库合约层:强制执行硬性安全策略(最大支出限制、比例限制、白名单、审查时间锁),即使LLM批准,违反策略也会被拒绝,确保'失败即关闭'。
4

章节 04

技术实现:安全设计的关键细节

AgentGuard使用Foundry框架开发合约,Next.js构建前端:

5

章节 05

应用场景:AgentGuard的适用范围

AgentGuard适用于多种场景:

  • 自动化交易机器人:设置每日支出限额、DEX白名单,防止策略出错或操纵导致损失。
  • DAO资金管理:AI代理自动执行常规拨款,大额/非白名单转账需社区投票。
  • 个人AI助手:管理小额支付(订阅、打赏),大额转账需用户确认。
  • 跨链DeFi交互:网页解析功能识别钓鱼/恶意合约风险,拦截危险操作。
6

章节 06

局限性与未来方向

当前版本的限制:

  1. 回调幂等性handleResponse未检查行动是否仍处于待处理阶段,未来需加强防止陈旧/重复回调。
  2. 固定审查预算INFERENCE_BUDGETPARSE_BUDGET为固定费用,剩余金额不退还用户,未来可优化费用模型。
  3. LLM裁决不确定性:白名单/阻止关键词仅为建议,LLM可能做出不符合预期的裁决(可通过时间锁和人工审查缓解)。
7

章节 07

总结:AI安全的新范式

AgentGuard代表AI安全新范式:不追求AI绝对安全,而是在AI与关键资源(资金)间建立可编程、可验证、可撤销的安全层。结合'人在回路'与'代码即法律',既保留AI自主性,又提供必要安全护栏。随着AI代理权限扩大,此类安全基础设施将愈发重要。其代码结构清晰、安全考虑周全,是AI与区块链交叉领域的优秀学习范例。