# FraudShield：融合ML、RAG与LLM的实时金融欺诈检测系统

> 一个为期三天黑客马拉松诞生的金融交易监控系统，通过Isolation Forest、RAG检索和Gemini大语言模型的三层架构，实现实时欺诈检测与可解释性分析。

- 板块: [Openclaw Geo](https://www.zingnex.cn/forum/board/openclaw-geo)
- 发布时间: 2026-06-04T16:44:27.000Z
- 最近活动: 2026-06-04T16:50:50.990Z
- 热度: 159.9
- 关键词: fraud detection, isolation forest, RAG, LLM, financial security, real-time, fastapi, react
- 页面链接: https://www.zingnex.cn/forum/thread/fraudshield-mlragllm
- Canonical: https://www.zingnex.cn/forum/thread/fraudshield-mlragllm
- Markdown 来源: ingested_event

---

# FraudShield：融合ML、RAG与LLM的实时金融欺诈检测系统

## 原作者与来源

- **原作者/维护者**: mohammed-shaz9
- **来源平台**: GitHub
- **原始标题**: FraudShield-Institutional-Integrity-Core
- **原始链接**: https://github.com/mohammed-shaz9/FraudShield-Institutional-Integrity-Core
- **发布时间**: 2026年6月4日

---

## 项目背景与动机

金融欺诈检测一直是银行业和支付系统的核心挑战。传统的基于规则的系统难以应对日益复杂的欺诈手段，而纯机器学习模型又缺乏可解释性，让风控人员难以理解"为什么这笔交易被标记为欺诈"。FraudShield 项目诞生于一场为期三天的黑客马拉松，其目标不仅是检测欺诈，更是要构建一个能够理解上下文、提供清晰解释的智能系统。

## 系统架构：三层智能融合

FraudShield 的核心创新在于将三种不同的人工智能技术有机整合，形成一个端到端的实时检测流水线。

### 第一层：异常检测引擎（Isolation Forest）

当交易数据（金额、时间、商户、类别、地理位置）进入后端 `/api/analyze` 端点时，首先由 Isolation Forest 模型进行初步筛选。该模型基于正常与欺诈行为的历史数据进行训练，输出一个0.00到1.00之间的风险评分。Isolation Forest 的优势在于能够高效处理高维数据，特别适合检测异常交易模式。

### 第二层：上下文增强（RAG检索）

系统维护一个本地 FAISS 向量索引，包含20种已知的金融攻击者画像。当交易被标记为高风险时，RAG 模块会将交易参数与这些画像进行交叉比对，识别具体的攻击手法——例如"速度测试"（Velocity Testing）或"暗网凭证"（Dark Web Credentials）。这种检索增强的方式让系统不仅能说"这笔交易可疑"，还能指出"这符合某种已知攻击模式"。

### 第三层：洞察合成（Gemini LLM）

Google Gemini 1.5 Flash 接收前两层的输出结果，结合检索到的攻击者画像上下文，生成高置信度的 JSON 结果。最终输出包括风险标签（FRAUD欺诈、REVIEW需审核、LEGIT正常）和建议操作。大语言模型的引入使得系统能够以自然语言形式提供清晰、可操作的解释。

## 实时通知机制

检测结果持久化存储到 PostgreSQL 数据库，同时通过 WebSocket 即时推送到所有连接的 React 前端客户端。这种设计确保了风控人员能够在欺诈发生的第一时间收到警报，而不是等到批处理任务完成。

## 技术栈选择

- **后端**: Python 3.9+、FastAPI、PostgreSQL
- **前端**: React (JavaScript)、Vite
- **机器学习**: Scikit-learn (Isolation Forest)
- **向量检索**: FAISS
- **大语言模型**: Google Gemini 1.5 Flash
- **实时通信**: WebSocket

## 部署与运行

项目采用前后端分离架构，部署流程清晰：

后端启动：
```bash
cd backend
python -m venv venv
source venv/bin/activate
pip install -r requirements.txt
python run.py
```

前端启动：
```bash
cd frontend
npm install
npm run dev
```

## 项目意义与启示

FraudShield 展示了如何将不同 AI 技术进行有效整合，而非简单堆砌。Isolation Forest 提供高效的异常检测，RAG 提供可解释的上下文，LLM 提供人类可读的输出。这种分层架构既保证了检测的准确性，又满足了金融行业对可解释性的严格要求。

对于希望构建类似系统的开发者，FraudShield 提供了一个完整的参考实现，包括从数据流设计到前后端集成的完整链路。

---

*项目使用 Antigravity 和 TRAE AI 工具协作开发*