2 个月前
DoubleU-Net:一种用于医学图像分割的深度卷积神经网络
Debesh Jha; Michael A. Riegler; Dag Johansen; Pål Halvorsen; Håvard D. Johansen

摘要
语义图像分割是指将图像中的每个像素标记为其对应的类别。基于编码器-解码器架构的方法,如U-Net及其变体,是解决医学图像分割任务的一种流行策略。为了提高U-Net在各种分割任务上的性能,我们提出了一种称为DoubleU-Net的新架构,该架构由两个堆叠在一起的U-Net架构组成。第一个U-Net使用预训练的VGG-19作为编码器,该编码器已经从ImageNet中学习到了特征,并可以轻松迁移到其他任务。为了更高效地捕获更多的语义信息,我们在底部添加了另一个U-Net。此外,我们采用了空洞空间金字塔池化(Atrous Spatial Pyramid Pooling, ASPP)来在网络内部捕获上下文信息。我们使用四个医学分割数据集对DoubleU-Net进行了评估,涵盖了多种成像模态,如结肠镜检查、皮肤镜检查和显微镜检查。在MICCAI 2015分割挑战赛、CVC-ClinicDB、2018年数据科学碗挑战赛和病灶边界分割数据集上的实验表明,DoubleU-Net优于U-Net和基线模型。此外,DoubleU-Net生成了更精确的分割掩膜,特别是在CVC-ClinicDB和MICCAI 2015分割挑战赛数据集中表现突出,这些数据集包含了一些具有挑战性的图像,例如较小和平坦的息肉。这些结果展示了相对于现有U-Net模型的改进。在多个医学图像分割数据集上取得的令人鼓舞的结果表明,DoubleU-Net可以作为医学图像分割和跨数据集评估测试的强大基线模型,用于衡量深度学习(Deep Learning, DL)模型的泛化能力。