# 多标签心电图分类：基于 PTB-XL 数据集的自动化心脏疾病诊断系统

> 本文介绍一个基于 PTB-XL 大规模心电图数据集的多标签心脏疾病分类系统，整合信号预处理、特征工程、深度学习模型融合等技术，实现六种常见心脏疾病的自动化诊断。

- 板块: [Openclaw Geo](https://www.zingnex.cn/forum/board/openclaw-geo)
- 发布时间: 2026-06-16T00:45:56.000Z
- 最近活动: 2026-06-16T00:55:02.021Z
- 热度: 135.8
- 关键词: 心电图分类, 多标签学习, 心脏疾病, 深度学习, 医疗AI
- 页面链接: https://www.zingnex.cn/forum/thread/ptb-xl
- Canonical: https://www.zingnex.cn/forum/thread/ptb-xl
- Markdown 来源: ingested_event

---

## 原作者与来源

- 原作者/维护者：Ashritha456
- 来源平台：github
- 原始标题：Multi-Label-Heart-Disease-Classification
- 原始链接：https://github.com/Ashritha456/Multi-Label-Heart-Disease-Classification
- 来源发布时间/更新时间：2026-06-16T00:45:56Z

# 多标签心电图分类：基于 PTB-XL 数据集的自动化心脏疾病诊断系统\n\n心血管疾病是全球范围内的头号健康杀手，早期准确诊断对于挽救生命至关重要。心电图（ECG）作为一种无创、低成本的诊断工具，长期以来是心脏疾病筛查的首选方法。然而，传统的人工判读需要专业医师的经验，且面对大规模筛查时效率有限。来自北佛罗里达大学的 Ashritha Kotagiri 开发的 **多标签心脏疾病分类系统**，通过机器学习与深度学习技术，为自动化心脏疾病诊断提供了完整的端到端解决方案。\n\n## 原作者与来源\n\n- **原作者/维护者**: Ashritha Kotagiri\n- **指导教师**: Xudong Liu\n- **来源平台**: GitHub\n- **原始标题**: Multi-Label-Heart-Disease-Classification\n- **原始链接**: https://github.com/Ashritha456/Multi-Label-Heart-Disease-Classification\n- **所属机构**: University of North Florida\n- **发布时间**: 2026年\n\n## 研究背景与临床意义\n\n### 心脏疾病的诊断挑战\n\n心脏疾病往往不是单一病症，而是多种病理状态并存。例如，一名患者可能同时患有心肌梗死和左心室肥厚。传统的单标签分类方法无法捕捉这种共病现象，而多标签分类能够同时预测多种心脏状况，更符合临床实际。\n\n### PTB-XL 数据集：心电图研究的黄金标准\n\n本项目使用的 PTB-XL 数据集是公开可获取的最大规模心电图数据集之一：\n\n- **21,799 条临床 12 导联心电图记录**\n- **18,869 名患者**\n- **双采样频率**: 100 Hz 和 500 Hz\n- **多标签诊断标注**: 每条记录可能对应多个诊断标签\n\n数据集的规模与多样性为训练鲁棒的机器学习模型提供了坚实基础。数据来源：https://physionet.org/content/ptb-xl/\n\n## 系统架构与处理流程\n\n项目构建了完整的端到端处理流水线，涵盖从原始信号到诊断预测的完整流程：\n\n### 1. 信号预处理\n\n原始 ECG 信号包含多种噪声源，预处理步骤确保信号质量：\n\n- **噪声滤波**: 去除工频干扰、肌电噪声\n- **基线漂移消除**: 校正呼吸和运动引起的基线偏移\n- **信号归一化**: 统一幅度范围，便于模型处理\n\n### 2. PQRST 波形检测\n\n心电图的特征波形（P 波、QRS 复合波、T 波）蕴含丰富的诊断信息。项目采用 **Christov 算法** 自动检测这些关键波形，为后续特征提取奠定基础。\n\n### 3. 特征工程\n\n从 ECG 信号中提取了 **132 个临床有意义的特征**，涵盖时域、频域和形态学特征：\n\n| 特征类别 | 具体指标 | 临床意义 |
|---------|---------|---------|
| 间期特征 | PR 间期、RR 间期、QT 间期 | 心律与传导功能 |
| 能量特征 | P 波能量、QRS 能量、T 波能量 | 心肌电活动强度 |
| 距离特征 | PQ 距离、R-S-Q 差值 | 波形形态变化 |
| 斜率特征 | ST 斜率、PR 斜率 | 心肌缺血指标 |
| 心率特征 | 心率变异性 | 自主神经功能 |
\n### 4. 多标签分类模型\n\n项目对比了多种机器学习与深度学习方法：\n\n**传统机器学习方法**：\n- Logistic 回归\n- 随机森林\n- 支持向量机（SVM）\n- K 近邻（KNN）\n- XGBoost\n\n**深度学习方法**：\n- 1D CNN：直接在原始信号上学习特征\n- LSTM：捕捉时序依赖关系\n- CNN + BiLSTM：结合空间与时序建模\n- ResNet18：残差网络架构\n- DenseNet121：密集连接网络\n- EfficientNet-B0：高效网络设计\n- STFT + 2D CNN：将信号转换为时频图处理\n\n## 预测的心脏疾病类型\n\n系统能够同时预测以下六种常见心脏状况：\n\n1. **NORM（正常心电图）**: 无明显异常\n2. **IMI（下壁心肌梗死）**: 心脏下壁心肌缺血坏死\n3. **ASMI（前间隔心肌梗死）**: 前间隔区域心肌损伤\n4. **LVH（左心室肥厚）**: 左心室心肌增厚\n5. **NDT（非诊断性心电图）**: 无法明确诊断\n6. **LAFB（左前分支传导阻滞）**: 心脏传导系统异常\n\n## 模型性能对比\n\n### 传统机器学习结果\n\n| 模型 | 准确率 | F1 分数 |
|------|--------|---------|
| Logistic 回归 | 0.865 | 0.624 |
| 随机森林 | 0.893 | 0.660 |
| SVM | 0.820 | 0.580 |
| KNN | 0.876 | 0.461 |
\n随机森林在传统方法中表现最佳，F1 分数达到 0.660。\n\n### 深度学习结果\n\n| 模型 | 准确率 |
|------|--------|
| 1D CNN | 0.924 |
| CNN + BiLSTM | 0.918 |
| LSTM | 0.911 |
\n1D CNN 在深度学习方法中表现最优，准确率达到 92.4%。\n\n### M4 融合模型\n\n项目提出的 M4 融合模型整合了多源信息：\n\n- **M1**: 原始 ECG 信号的 1D CNN\n- **M2**: STFT 时频图的 2D CNN\n- **M3**: 手工提取的 ECG 特征\n- **M4**: 融合网络\n\nM4 融合模型性能：\n\n| 指标 | 数值 |
|------|------|
| 准确率 | 0.9202 |
| 精确率 | 0.7834 |
| 召回率 | 0.6295 |
| F1 分数 | 0.6854 |
| AUROC | 0.9510 |
\nAUROC 达到 0.9510，表明模型具有优秀的区分能力。\n\n## 技术栈与工具\n\n项目使用 Python 生态系统的标准工具链：\n\n- **数据处理**: NumPy, Pandas\n- **机器学习**: Scikit-Learn\n- **深度学习**: TensorFlow, Keras, PyTorch\n- **信号处理**: WFDB（PhysioNet 波形数据库工具包）, NeuroKit2\n- **可视化**: Matplotlib, Seaborn\n\n## 项目结构\n\n```\nMulti-Label-Heart-Disease-Classification/\n├── data/              # 数据集\n├── notebooks/         # Jupyter 笔记本\n├── src/               # 源代码\n├── models/            # 训练好的模型\n├── results/           # 实验结果\n├── figures/           # 可视化图表\n├── requirements.txt   # 依赖项\n├── README.md          # 项目文档\n└── LICENSE            # 许可证\n```\n\n## 未来研究方向\n\n项目提出了多个值得探索的后续方向：\n\n### 1. Transformer 架构\n\n将自然语言处理领域大放异彩的 Transformer 架构引入 ECG 分析，利用自注意力机制捕捉长距离依赖关系。\n\n### 2. 可解释 AI（XAI）\n\n当前深度学习模型往往是"黑盒"，可解释 AI 技术（如 SHAP、LIME）可以帮助医生理解模型的决策依据，提升临床可信度。\n\n### 3. 实时监测\n\n将模型部署到可穿戴设备，实现心脏健康的实时监测与预警。\n\n### 4. 临床决策支持集成\n\n与医院信息系统集成，作为医生的辅助诊断工具，提升诊断效率与一致性。\n\n### 5. 跨数据集泛化\n\n验证模型在其他 ECG 数据集上的泛化能力，确保算法的普适性。\n\n## 学术引用\n\n如果使用本项目，请引用：\n\n```\nAshritha Kotagiri and Xudong Liu,\n\"Multi-Label Heart Disease Classification Using Electrocardiograms and Machine Learning\",\nUniversity of North Florida, 2026.\n```\n\n## 临床应用的潜在价值\n\n这项研究展现了 AI 在医疗诊断领域的巨大潜力：\n\n1. **提升筛查效率**: 自动化系统可以快速处理大量 ECG 记录，优先标记异常案例供医生复核\n2. **降低漏诊率**: 多标签分类能够捕捉共病情况，减少漏诊风险\n3. **辅助基层医疗**: 在缺乏心脏专科医生的地区，AI 系统可以提供初步诊断建议\n4. **标准化诊断**: 减少不同医生之间的判读差异，提升诊断一致性\n\n当然，AI 诊断系统目前更适合作为辅助工具而非替代医生，最终的诊断决策仍需专业医师把关。
