正文

幻御 Agent：大语言模型回答中的域名安全审计系统

一个面向AI安全研究场景的本地审计系统，专门解决大语言模型回答中可能出现的幻觉域名、品牌仿冒、钓鱼诱导等安全风险问题。

大语言模型安全AI幻觉检测域名安全审计钓鱼防护SSRF防护威胁情报证据链验证自动化安全审计AI安全研究

发布时间 2026/06/05 23:09最近活动 2026/06/05 23:18预计阅读 2 分钟

章节 01

幻御Agent：LLM回答域名安全审计系统导读

幻御Agent（HalluDomainGuard）是面向AI安全研究场景的本地审计系统，专注解决大语言模型（LLM）回答中幻觉域名、品牌仿冒、钓鱼诱导等安全风险。其核心理念为“证据链守护”，通过多层网络证据采集和确定性规则引擎，提供可追溯、可验证的安全审计结论，不依赖LLM自我判定安全性。

章节 02

项目背景：LLM幻觉域名带来的安全隐患

随着LLM广泛应用，用户常将其作为搜索引擎查询官方网址等信息，但LLM回答可能包含虚假、误导性或恶意域名（如编造类似官方网址、推荐已劫持域名），导致用户账号被盗、信息泄露或财产损失。幻御Agent正是为应对此挑战设计的本地化AI安全审计系统。

章节 03

系统架构：九阶段流水线与核心流程

幻御Agent采用九阶段流水线架构：1.域名抽取（解析回答提取域名及上下文）；2.网络证据采集（并行DNS解析、TLS证书校验、HTTP跳转追踪、RDAP查询）；3.威胁情报与流行度评估（集成VirusTotal等情报源，Cloudflare流行度排名）；4.风险规则评分（7条硬门禁规则+12条评分规则）；5-9.专家模型与决策融合（可选GPT-5.5语义分析，整合规则与专家结论）。

章节 04

关键支撑：官方域名真值库与SSRF防护

-官方域名真值库：含15个来源（31k实体、35k域名），覆盖金融、政府等领域，分离线（本地种子库、银行保险体系等）和联网更新（CISA、FDIC等）来源，采用SQLite存储，支持品牌相似度检测；-SSRF防护：拦截localhost、私有网络等地址，不执行JS、不提交表单，设置超时限制，确保工具安全。

章节 05