Zing 论坛

正文

DeepTrace:浏览器端的AI网络取证系统,实时识别钓鱼链接、诈骗文本与AI生成内容

一款集成多模型 ensemble 的 Chrome 浏览器扩展,通过 XGBoost + LightGBM 检测钓鱼 URL,DeBERTa 识别诈骗文本,RoBERTa 辨别 AI 生成内容,元决策引擎综合输出风险评级与可解释建议。

网络安全钓鱼检测AI生成内容识别浏览器扩展机器学习NLPXGBoostDeBERTaRoBERTaFastAPI
发布时间 2026/06/13 20:16最近活动 2026/06/13 20:19预计阅读 3 分钟
DeepTrace:浏览器端的AI网络取证系统,实时识别钓鱼链接、诈骗文本与AI生成内容
1

章节 01

【导读】DeepTrace:浏览器端AI网络取证系统,实时识别钓鱼、诈骗与AI生成内容

本文介绍由ZeehaanShah开发并维护的Chrome浏览器扩展DeepTrace,这是一款集成多模型ensemble的AI网络取证系统。其核心功能包括实时检测钓鱼URL、识别诈骗文本、辨别AI生成内容,并通过元决策引擎输出风险评级与可解释建议。该系统本地运行,兼顾响应速度与隐私保护,2025年发布并持续维护,源码可在GitHub获取(链接:https://github.com/ZeehaanShah/DeepTrace-Cyber-Forensics)。

2

章节 02

背景:网络威胁的语言学转向与DeepTrace的诞生

2025年网络攻击已转向"语言学攻击"——利用人类心理弱点(如欺骗判断力),传统安全软件难以应对。DeepTrace针对此挑战,将取证能力嵌入浏览器,在用户遭遇威胁的第一现场提供实时保护。与云端服务不同,它在本地运行,既保证响应速度,又保护用户隐私。

3

章节 03

系统架构:三层检测模块+元决策引擎

DeepTrace采用模块化设计:

  1. 钓鱼URL检测:XGBoost+LightGBM ensemble模型(50/50权重),提取52个特征(长度、字符统计、结构标志等),性能:准确率94.81%,F1=0.9539,AUC-ROC=0.9885;
  2. 诈骗文本检测:微调DeBERTa-v3-xsmall模型+9条规则检测器+25+风险关键词,性能:准确率98%,F1=0.9801;
  3. AI生成内容检测:基于RoBERTa的预训练模型(Hello-SimpleAI/chatgpt-detector-roberta),在HC3数据集训练,准确率约97%;
  4. 元决策引擎:逻辑回归融合三模块结果,输出正常/钓鱼/AI生成评级,交叉验证准确率99.19%±0.15%。
4

章节 04

技术实现:FastAPI后端与Chrome扩展前端

DeepTrace技术栈:

  • 后端:Python3.11+FastAPI框架,提供RESTful API,SlowAPI限速(30次/分钟),Docker容器化部署;
  • 前端:Chrome扩展(Manifest V3),含Service Worker(后台处理)、侧边栏UI(结果渲染)、内容脚本(文本选择按钮);
  • 模型服务:后端缓存三模块模型,通过/api/v1/analyze统一分析端点。
5

章节 05

测试用例与性能验证

项目提供典型测试用例:

输入 预期结果 检测模块
http://paypa1-secure-login.xyz/verify 🚨钓鱼链接 URL
https://www.google.com ✅正常 URL
"Dear customer, your account is suspended. Verify your OTP immediately." 🚨钓鱼文本 文本
"Hi John, meeting at 3pm tomorrow. Bring the Q3 slides." ✅正常 文本
AI生成段落 ⚠️AI生成 AI检测
各模块性能:URL检测准确率94.81%,文本检测98%,AI生成内容检测97%(HC3基准),元引擎交叉验证准确率99.19%。
6

章节 06

项目意义与启示

DeepTrace代表网络安全工具的发展方向:从被动防御到主动识别,从云端到本地实时分析,从黑盒到可解释输出。对用户:浏览器内获得专业安全分析,无需企业级软件;对开发者:展示多AI模型整合与浏览器扩展集成的方法;更重要的是,它反映AI时代安全威胁的演变——检测AI生成内容的工具本身也是AI技术产物,开启真伪辨别的技术军备竞赛。