Zing 论坛

正文

皮肤病变自动分类:多模型深度学习集成方案

本文介绍了一个基于深度学习的皮肤镜图像分类系统,采用ResNet50、DenseNet121和EfficientNet-B3三种骨干网络的加权集成,结合测试时增强(TTA)和临床阈值校准技术,在ISIC 2018挑战数据集上实现了优异的分类性能,特别针对恶性病变的敏感性进行了优化。

深度学习医学影像皮肤病变分类卷积神经网络模型集成测试时增强ISIC皮肤镜PyTorch计算机辅助诊断
发布时间 2026/06/01 16:14最近活动 2026/06/01 16:22预计阅读 3 分钟
皮肤病变自动分类:多模型深度学习集成方案
1

章节 01

导读 / 主楼:皮肤病变自动分类:多模型深度学习集成方案

本文介绍了一个基于深度学习的皮肤镜图像分类系统,采用ResNet50、DenseNet121和EfficientNet-B3三种骨干网络的加权集成,结合测试时增强(TTA)和临床阈值校准技术,在ISIC 2018挑战数据集上实现了优异的分类性能,特别针对恶性病变的敏感性进行了优化。

2

章节 02

原作者与来源

  • 原作者/维护者:daorre1202(Daniel Ortiz Requena)
  • 来源平台:GitHub
  • 原项目标题:skin-lesion-classifier
  • 原始链接https://github.com/daorre1202/skin-lesion-classifier
  • 开源协议:项目采用开源许可(具体协议见仓库LICENSE文件)
  • 发布时间:2026年6月1日
3

章节 03

项目背景与临床意义

皮肤镜(Dermoscopy)是一种非侵入性皮肤成像技术,能够放大皮肤病变区域,帮助医生观察表皮和真皮浅层的细微结构。然而,皮肤镜图像的解读需要丰富的临床经验,不同医生之间的诊断一致性也存在差异。

ISIC(International Skin Imaging Collaboration)2018挑战赛任务3的目标是对皮肤镜图像进行七分类诊断,包括:黑色素瘤(MEL)、黑色素细胞痣(NV)、基底细胞癌(BCC)、光化性角化病(AKIEC)、良性角化病(BKL)、皮肤纤维瘤(DF)和血管病变(VASC)。其中,恶性病变的早期识别尤为重要。

4

章节 04

多骨干网络集成策略

该项目采用三种经过ImageNet预训练的卷积神经网络作为骨干:

  1. ResNet50:残差网络,通过跳跃连接解决深层网络的梯度消失问题
  2. DenseNet121:密集连接网络,特征重用效率高,参数量相对较少
  3. EfficientNet-B3:复合缩放网络,在精度和效率之间取得良好平衡

三种网络独立训练后,通过验证集平衡准确率(BACC)加权融合,形成最终的集成预测。这种策略充分利用了不同架构的互补性,有效降低了单一模型的偏差。

5

章节 05

测试时增强(TTA)技术

传统的深度学习模型在推理时仅对输入图像进行一次前向传播。该项目引入了测试时增强技术,在推理阶段对每张图像应用10种不同的几何变换(如旋转、翻转、缩放等),然后对所有变换后的预测结果取平均。这种技术能够显著提升模型的鲁棒性,减少过拟合风险。

6

章节 06

临床阈值校准机制

这是本项目最具临床价值的创新点。标准深度学习模型通常采用0.5作为分类阈值,但这在医学诊断场景中往往不够合理。例如,对于黑色素瘤(MEL)这类恶性病变,漏诊的代价远高于误诊。

项目作者设计了类别特定的阈值校准策略:

  • 黑色素瘤(MEL):要求敏感性≥0.85且特异性≥0.85
  • 光化性角化病(AKIEC):要求敏感性≥0.75且特异性≥0.70

这种两级回退机制(严格阈值→宽松阈值→标准argmax)能够在保证恶性病变检出率的同时,维持整体分类性能。实验表明,该策略使恶性类别的平衡准确率提升了0.02至0.05,而对全局BACC的影响微乎其微。

7

章节 07

数据集与实验设置

项目使用HAM10000数据集,包含10015张皮肤镜图像,涵盖7种诊断类别。数据划分采用60%训练集、20%验证集、20%测试集的层次化分割策略,确保各类别比例一致。

值得注意的是,数据集存在严重的类别不平衡问题:黑色素细胞痣(NV)样本数超过4000例,而皮肤纤维瘤(DF)仅有96例。项目通过分级增强策略应对这一挑战,为少数类应用更强的数据增强。

此外,项目采用Focal Loss作为损失函数,对难分样本赋予更高权重,进一步提升模型对罕见类别的识别能力。

8

章节 08

实验结果与性能分析

在三组独立随机种子(42、7、123)上的实验表明,该系统具有出色的稳定性和泛化能力:

指标 数值
TTA集成BACC(均值±标准差) 0.846 ± 0.009
最佳单次TTA BACC 0.8607
恶性类别BACC(MEL+BCC+AKIEC) 最高0.839
黑色素瘤敏感性(临床阈值) 最高0.877

与ISIC 2018挑战赛其他方法的对比显示,尽管冠军方案(MetaOptima)使用了外部数据集和更大的模型集成,但本项目在仅使用HAM10000数据的情况下,性能已接近顶级水平。更重要的是,±0.009的标准差证明了系统的鲁棒性。