Zing 论坛

正文

PHISHIELD:三层架构AI驱动的钓鱼检测系统

一个结合规则引擎、AI模型和浏览器扩展的综合性钓鱼攻击检测解决方案,通过多层评分机制实现高准确率的风险识别。

钓鱼检测网络安全AI安全浏览器扩展FastAPI机器学习威胁情报
发布时间 2026/06/02 17:13最近活动 2026/06/02 17:18预计阅读 3 分钟
PHISHIELD:三层架构AI驱动的钓鱼检测系统
1

章节 01

PHISHIELD: 三层架构AI驱动的钓鱼检测系统导读

PHISHIELD是一个结合规则引擎、AI模型和浏览器扩展的综合性钓鱼攻击检测解决方案,通过多层评分机制实现高准确率的风险识别。该系统旨在应对传统防护手段失效的问题,提供端到端的检测能力,涵盖Web仪表板、浏览器扩展和统一后端API。

2

章节 02

背景与问题

钓鱼攻击是当今网络安全领域最普遍且危害最大的威胁之一,超过90%的数据泄露事件始于钓鱼邮件或恶意链接。传统防护依赖黑名单和规则匹配,但攻击者技术演进使其逐渐失效(如URL混淆、域名仿冒等)。PHISHIELD作为为期四周的硕士毕业设计项目,目标是构建端到端AI驱动的钓鱼检测系统。

3

章节 03

系统架构概览

PHISHIELD采用三层检测架构:

  1. 规则引擎层:含Google Safe Browsing API(权重40%)、URLhaus黑名单(30%)、WHOIS域名年龄分析(15%)、启发式规则(15%),快速初步筛选。
  2. NLP/AI层:利用GPT-4o-mini模型分析邮件主题/正文或URL语义,评估紧急性、语法质量、链接可信度等维度,返回结构化评分。
  3. HTTP头部分析层:检测目标网站安全配置缺陷(如缺失CSP/HSTS头)、异常服务器指纹、重定向链等。
4

章节 04

集成评分机制

三层结果通过集成评分器加权组合生成0-100最终风险评分:

  • 0-30:安全(clean)
  • 31-70:可疑(suspicious),建议谨慎
  • 71-100:钓鱼(phishing),避免访问 系统提取前3个判定理由,并将扫描记录持久化到PostgreSQL数据库支持历史查询与反馈收集。
5

章节 05

技术栈与核心API

技术栈

  • 后端:FastAPI、PostgreSQL(Neon)、SQLAlchemy、Pydantic
  • 前端:React18、TypeScript、Tailwind CSS
  • 浏览器扩展:Chrome Manifest V3、Service Worker、Content Script 核心API端点: POST /analyze/url(URL分析)、POST /analyze/email(邮件分析)、POST /analyze/email/upload(eml上传)、GET /history(历史记录)、GET /health(健康检查)。
6

章节 06

部署与使用场景

PHISHIELD支持多场景:

  • 个人用户:Chrome扩展实时风险提示,主动扫描URL/上传邮件。
  • 企业安全:Web仪表板集中分析,批量检测、历史审计、反馈优化。
  • 开发者集成:开放REST API,JSON响应,易集成第三方应用。
7

章节 07

项目意义与启示

PHISHIELD展示现代网络安全防护范式:

  1. 多层防御:规则+AI+协议分析组合提升准确率;
  2. 人机协同:AI提供判断,用户决策,反馈闭环优化;
  3. 全栈覆盖:后端API到前端界面再到扩展,完整体验;
  4. 可扩展架构:模块化设计支持未来添加新检测能力。 为安全开发者/研究者提供参考,展示传统规则与现代AI结合的实践。