章节 01
导读 / 主楼:皮肤病变自动分类:多模型深度学习集成方案
本文介绍了一个基于深度学习的皮肤镜图像分类系统,采用ResNet50、DenseNet121和EfficientNet-B3三种骨干网络的加权集成,结合测试时增强(TTA)和临床阈值校准技术,在ISIC 2018挑战数据集上实现了优异的分类性能,特别针对恶性病变的敏感性进行了优化。
正文
本文介绍了一个基于深度学习的皮肤镜图像分类系统,采用ResNet50、DenseNet121和EfficientNet-B3三种骨干网络的加权集成,结合测试时增强(TTA)和临床阈值校准技术,在ISIC 2018挑战数据集上实现了优异的分类性能,特别针对恶性病变的敏感性进行了优化。
章节 01
本文介绍了一个基于深度学习的皮肤镜图像分类系统,采用ResNet50、DenseNet121和EfficientNet-B3三种骨干网络的加权集成,结合测试时增强(TTA)和临床阈值校准技术,在ISIC 2018挑战数据集上实现了优异的分类性能,特别针对恶性病变的敏感性进行了优化。
章节 02
章节 03
皮肤镜(Dermoscopy)是一种非侵入性皮肤成像技术,能够放大皮肤病变区域,帮助医生观察表皮和真皮浅层的细微结构。然而,皮肤镜图像的解读需要丰富的临床经验,不同医生之间的诊断一致性也存在差异。
ISIC(International Skin Imaging Collaboration)2018挑战赛任务3的目标是对皮肤镜图像进行七分类诊断,包括:黑色素瘤(MEL)、黑色素细胞痣(NV)、基底细胞癌(BCC)、光化性角化病(AKIEC)、良性角化病(BKL)、皮肤纤维瘤(DF)和血管病变(VASC)。其中,恶性病变的早期识别尤为重要。
章节 04
该项目采用三种经过ImageNet预训练的卷积神经网络作为骨干:
三种网络独立训练后,通过验证集平衡准确率(BACC)加权融合,形成最终的集成预测。这种策略充分利用了不同架构的互补性,有效降低了单一模型的偏差。
章节 05
传统的深度学习模型在推理时仅对输入图像进行一次前向传播。该项目引入了测试时增强技术,在推理阶段对每张图像应用10种不同的几何变换(如旋转、翻转、缩放等),然后对所有变换后的预测结果取平均。这种技术能够显著提升模型的鲁棒性,减少过拟合风险。
章节 06
这是本项目最具临床价值的创新点。标准深度学习模型通常采用0.5作为分类阈值,但这在医学诊断场景中往往不够合理。例如,对于黑色素瘤(MEL)这类恶性病变,漏诊的代价远高于误诊。
项目作者设计了类别特定的阈值校准策略:
这种两级回退机制(严格阈值→宽松阈值→标准argmax)能够在保证恶性病变检出率的同时,维持整体分类性能。实验表明,该策略使恶性类别的平衡准确率提升了0.02至0.05,而对全局BACC的影响微乎其微。
章节 07
项目使用HAM10000数据集,包含10015张皮肤镜图像,涵盖7种诊断类别。数据划分采用60%训练集、20%验证集、20%测试集的层次化分割策略,确保各类别比例一致。
值得注意的是,数据集存在严重的类别不平衡问题:黑色素细胞痣(NV)样本数超过4000例,而皮肤纤维瘤(DF)仅有96例。项目通过分级增强策略应对这一挑战,为少数类应用更强的数据增强。
此外,项目采用Focal Loss作为损失函数,对难分样本赋予更高权重,进一步提升模型对罕见类别的识别能力。
章节 08
在三组独立随机种子(42、7、123)上的实验表明,该系统具有出色的稳定性和泛化能力:
| 指标 | 数值 |
|---|---|
| TTA集成BACC(均值±标准差) | 0.846 ± 0.009 |
| 最佳单次TTA BACC | 0.8607 |
| 恶性类别BACC(MEL+BCC+AKIEC) | 最高0.839 |
| 黑色素瘤敏感性(临床阈值) | 最高0.877 |
与ISIC 2018挑战赛其他方法的对比显示,尽管冠军方案(MetaOptima)使用了外部数据集和更大的模型集成,但本项目在仅使用HAM10000数据的情况下,性能已接近顶级水平。更重要的是,±0.009的标准差证明了系统的鲁棒性。