正文

皮肤病变自动分类：多模型深度学习集成方案

本文介绍了一个基于深度学习的皮肤镜图像分类系统，采用ResNet50、DenseNet121和EfficientNet-B3三种骨干网络的加权集成，结合测试时增强（TTA）和临床阈值校准技术，在ISIC 2018挑战数据集上实现了优异的分类性能，特别针对恶性病变的敏感性进行了优化。

深度学习医学影像皮肤病变分类卷积神经网络模型集成测试时增强ISIC皮肤镜PyTorch计算机辅助诊断

发布时间 2026/06/01 16:14最近活动 2026/06/01 16:22预计阅读 3 分钟

章节 01

导读 / 主楼：皮肤病变自动分类：多模型深度学习集成方案

章节 02

原作者与来源

原作者/维护者：daorre1202（Daniel Ortiz Requena）
来源平台：GitHub
原项目标题：skin-lesion-classifier
原始链接：https://github.com/daorre1202/skin-lesion-classifier
开源协议：项目采用开源许可（具体协议见仓库LICENSE文件）
发布时间：2026年6月1日

章节 03

项目背景与临床意义

皮肤镜（Dermoscopy）是一种非侵入性皮肤成像技术，能够放大皮肤病变区域，帮助医生观察表皮和真皮浅层的细微结构。然而，皮肤镜图像的解读需要丰富的临床经验，不同医生之间的诊断一致性也存在差异。

ISIC（International Skin Imaging Collaboration）2018挑战赛任务3的目标是对皮肤镜图像进行七分类诊断，包括：黑色素瘤（MEL）、黑色素细胞痣（NV）、基底细胞癌（BCC）、光化性角化病（AKIEC）、良性角化病（BKL）、皮肤纤维瘤（DF）和血管病变（VASC）。其中，恶性病变的早期识别尤为重要。

章节 04

多骨干网络集成策略

该项目采用三种经过ImageNet预训练的卷积神经网络作为骨干：

ResNet50：残差网络，通过跳跃连接解决深层网络的梯度消失问题
DenseNet121：密集连接网络，特征重用效率高，参数量相对较少
EfficientNet-B3：复合缩放网络，在精度和效率之间取得良好平衡

三种网络独立训练后，通过验证集平衡准确率（BACC）加权融合，形成最终的集成预测。这种策略充分利用了不同架构的互补性，有效降低了单一模型的偏差。

章节 05

测试时增强（TTA）技术

传统的深度学习模型在推理时仅对输入图像进行一次前向传播。该项目引入了测试时增强技术，在推理阶段对每张图像应用10种不同的几何变换（如旋转、翻转、缩放等），然后对所有变换后的预测结果取平均。这种技术能够显著提升模型的鲁棒性，减少过拟合风险。

章节 06

临床阈值校准机制

这是本项目最具临床价值的创新点。标准深度学习模型通常采用0.5作为分类阈值，但这在医学诊断场景中往往不够合理。例如，对于黑色素瘤（MEL）这类恶性病变，漏诊的代价远高于误诊。

项目作者设计了类别特定的阈值校准策略：

黑色素瘤（MEL）：要求敏感性≥0.85且特异性≥0.85
光化性角化病（AKIEC）：要求敏感性≥0.75且特异性≥0.70

这种两级回退机制（严格阈值→宽松阈值→标准argmax）能够在保证恶性病变检出率的同时，维持整体分类性能。实验表明，该策略使恶性类别的平衡准确率提升了0.02至0.05，而对全局BACC的影响微乎其微。

章节 07

数据集与实验设置

项目使用HAM10000数据集，包含10015张皮肤镜图像，涵盖7种诊断类别。数据划分采用60%训练集、20%验证集、20%测试集的层次化分割策略，确保各类别比例一致。

值得注意的是，数据集存在严重的类别不平衡问题：黑色素细胞痣（NV）样本数超过4000例，而皮肤纤维瘤（DF）仅有96例。项目通过分级增强策略应对这一挑战，为少数类应用更强的数据增强。

此外，项目采用Focal Loss作为损失函数，对难分样本赋予更高权重，进一步提升模型对罕见类别的识别能力。

章节 08

实验结果与性能分析

在三组独立随机种子（42、7、123）上的实验表明，该系统具有出色的稳定性和泛化能力：

指标	数值
TTA集成BACC（均值±标准差）	0.846 ± 0.009
最佳单次TTA BACC	0.8607
恶性类别BACC（MEL+BCC+AKIEC）	最高0.839
黑色素瘤敏感性（临床阈值）	最高0.877