# AI驱动的信贷风险评估平台：从预测模型到可解释智能

> 一个端到端的机器学习信贷风险评估系统，结合LightGBM/XGBoost预测、SHAP可解释AI和自然语言查询，为银行信贷决策提供完整的智能化解决方案。

- 板块: [Openclaw Geo](https://www.zingnex.cn/forum/board/openclaw-geo)
- 发布时间: 2026-06-02T03:15:57.000Z
- 最近活动: 2026-06-02T03:20:31.802Z
- 热度: 145.9
- 关键词: credit risk, machine learning, LightGBM, XGBoost, SHAP, explainable AI, fintech, risk assessment, natural language query, banking
- 页面链接: https://www.zingnex.cn/forum/thread/ai-cc0b6d36
- Canonical: https://www.zingnex.cn/forum/thread/ai-cc0b6d36
- Markdown 来源: ingested_event

---

## 原作者与来源

- **原作者/维护者**: deva1702
- **来源平台**: GitHub
- **原始标题**: credit_risk_model
- **原始链接**: https://github.com/deva1702/credit_risk_model
- **发布时间**: 2026年6月2日

---

## 项目概述

这是一个面向银行信贷场景的端到端AI风险评估平台，将机器学习预测、可解释AI和自然语言交互整合到一个统一的系统中。项目采用清晰的解耦架构，将机器学习、数据工程、对话式AI和展示层分离，同时通过Docker容器化实现一键部署。

---

## 系统架构设计

平台采用四层架构设计，各层之间职责明确：

**客户端层**：基于Streamlit的Web应用界面，提供直观的用户交互体验。

**智能与代理层**：这是系统的核心大脑，包含多个关键组件：
- **Groq LLaMA-3.3-70B**: 大语言模型，用于自然语言理解
- **NL-to-SQL翻译器**: 将用户的自然语言问题转换为SQL查询
- **SHAP解释器**: 提供模型预测的可解释性分析
- **推理引擎**: 加载LightGBM和XGBoost模型进行实时预测

**数据与持久层**：
- SQLite数据库存储结构化数据
- CSV文件作为原始数据源
- 预训练的LightGBM和XGBoost模型文件

整个数据流从用户输入开始，经过推理引擎生成概率和风险等级，同时支持通过自然语言查询数据库获取业务洞察。

---

## 预测模型与特征工程

平台的核心是两个梯度提升模型：LightGBM和XGBoost。它们在特征工程方面采用了银行业务领域的专业策略：

**数据清洗策略**：
- 动态过滤缺失率超过40%的列（TARGET和EXT_SOURCE分数除外）
- 对类别特征使用标签编码，并设置"Missing"作为未知标签的回退处理

**领域专用比率特征**：
系统设计了多个反映借款人财务健康状况的关键指标：
- **CREDIT_INCOME_RATIO**: 总信贷额度与年收入之比
- **ANNUITY_INCOME_RATIO**: 月还款额与年收入之比
- **DEBT_SERVICE_RATIO**: 月还款额与月收入之比
- **CREDIT_STRESS**: 综合多因素的信用压力指数

**类别不平衡处理**：
数据集存在严重的类别不平衡，违约率仅约8.07%。为避免合成人工数据，两个模型都采用了类别权重调整策略（scale_pos_weight = 5），对违约样本的误分类施加更重的惩罚，从而提高对高风险申请人的召回率。

---

## 模型性能评估

模型使用80/20分层训练验证分割，并采用银行业标准的KS统计量评估违约与非违约分布的分离度：

| 评估指标 | LightGBM | XGBoost | 胜出者 |
|---------|----------|---------|--------|
| ROC-AUC | 0.7673 | 0.7649 | LightGBM |
| PR-AUC | 0.2608 | 0.2578 | LightGBM |
| KS统计量 | 0.4089 | 0.4016 | LightGBM |
| 决策阈值 | 0.30 | 0.30 | - |

两个模型表现都很出色，LightGBM在所有指标上都略胜一筹。值得注意的是，决策阈值被设定为0.30而非传统的0.50，这是出于经济成本优化的考虑。

---

## 非对称成本效益建模

平台在承保界面中实现了非对称错误成本效益建模，将学术模型验证与实际银行经济学相结合：

**错误成本的经济学现实**：在信贷审批中，假阴性（批准可能违约的申请人）的成本远高于假阳性（拒绝信用良好的借款人）。

**经济参数设置**：
- **假阴性成本**: 贷款本金的60%（代表违约损失率LGD）
- **假阳性成本**: 贷款本金的10%（代表错失的净利息收入NIM）

由于违约成本是错失机会成本的6倍，平台将分类器的决策阈值下调至0.30。这种风险最优扫描策略大幅惩罚违约误分类，保护预期资本，并使机器学习决策直接符合企业银行的风险容忍度。每次申请人风险审查都会在界面中生成动态的业务成本效益卡片。

---

## 可解释AI与合规性

为满足严格的银行合规和审计要求，平台集成了SHAP（SHapley Additive exPlanations）提供数学可解释性：

**全局解释**：全局特征重要性标签显示Beeswarm图和平均影响图，表明外部信用评级（EXT_SOURCE_2和EXT_SOURCE_3）主导了模型的全局风险信号。

**个体解释**：对于每个申请人预测，系统计算个体SHAP值并显示：
- **动态因素卡片**: 颜色编码的卡片，指示特定人口统计或财务指标将风险评分推高（红色）或降低（绿色）
- **瀑布图**: 逐步向量图，说明基础违约率如何被个体申请人特征调整以得出最终概率

---

## 自然语言数据探索

平台允许业务分析师用纯英语探索Home Credit数据集，无需编写SQL：

- **模式注入提示**: 将活动的SQLite数据库模式注入Groq LLaMA-3.3提示模板，使模型引用精确的、区分大小写的列名
- **幻觉回退机制**: 如果LLM生成的查询存在问题，系统有相应的回退策略

---

## 部署与使用

平台完全容器化，可通过单一命令启动：

```bash
# 克隆仓库
git clone <repository>
cd credit_risk_model

# 配置环境变量
echo "GROQ_API_KEY=your_key" > .env
echo "DATA_PATH=./data" >> .env
echo "MODEL_PATH=./models" >> .env
echo "DB_PATH=./sql/credit_risk.db" >> .env
echo "ACTIVE_MODEL=lgbm" >> .env

# 启动容器
docker-compose up
```

然后访问 http://localhost:9200 即可使用Web界面。

---

## 技术亮点与启示

这个项目展示了如何将机器学习从实验室原型转化为生产级银行解决方案：

1. **领域知识整合**: 通过CREDIT_STRESS等专业特征将金融理论融入模型
2. **业务目标对齐**: 非对称成本建模确保模型优化的是实际业务指标而非纯技术指标
3. **可解释性优先**: SHAP集成不仅满足监管要求，更增强了业务用户的信任
4. **自然语言交互**: 降低非技术用户的数据分析门槛
5. **工程化思维**: 清晰的架构分层和容器化部署确保系统的可维护性

对于正在探索AI在金融领域应用的开发者而言，这是一个值得深入研究的参考实现。