摘要
在医学领域,深度学习模型通常基于自然图像进行训练,并被广泛应用于各类分类任务。一般情况下,高维医学图像在输入到符合ImageNet标准、仅接受224×224像素低分辨率图像的深度学习模型之前,需通过插值等技术进行下采样。这一常用方法可能导致关键信息的丢失,从而影响分类性能。值得注意的是,医学图像中的显著病理特征通常尺寸较小,且极易受到下采样过程的影响。为解决该问题,本文提出一种基于卷积神经网络(CNN)的分类方法,该方法通过一个自编码器网络学习图像的降分辨率过程,同时利用另一个网络实现图像分类,且两个任务在训练过程中联合优化。该算法引导模型从高分辨率图像中学习对分类任务至关重要的特征表示,同时完成图像重建任务。我们在公开可用的胸部X光片数据集上对所提方法进行了评估,实验结果在测试集上超越了当前最先进的性能。此外,我们还系统研究了不同数据增强策略在该数据集上的影响,并基于若干经典的ImageNet预训练CNN架构建立了基准性能。