8 个月前

摘要

语义图像分割是指将图像中的每个像素标记为其对应的类别。基于编码器-解码器架构的方法，如U-Net及其变体，是解决医学图像分割任务的一种流行策略。为了提高U-Net在各种分割任务上的性能，我们提出了一种称为DoubleU-Net的新架构，该架构由两个堆叠在一起的U-Net架构组成。第一个U-Net使用预训练的VGG-19作为编码器，该编码器已经从ImageNet中学习到了特征，并可以轻松迁移到其他任务。为了更高效地捕获更多的语义信息，我们在底部添加了另一个U-Net。此外，我们采用了空洞空间金字塔池化（Atrous Spatial Pyramid Pooling, ASPP）来在网络内部捕获上下文信息。我们使用四个医学分割数据集对DoubleU-Net进行了评估，涵盖了多种成像模态，如结肠镜检查、皮肤镜检查和显微镜检查。在MICCAI 2015分割挑战赛、CVC-ClinicDB、2018年数据科学碗挑战赛和病灶边界分割数据集上的实验表明，DoubleU-Net优于U-Net和基线模型。此外，DoubleU-Net生成了更精确的分割掩膜，特别是在CVC-ClinicDB和MICCAI 2015分割挑战赛数据集中表现突出，这些数据集包含了一些具有挑战性的图像，例如较小和平坦的息肉。这些结果展示了相对于现有U-Net模型的改进。在多个医学图像分割数据集上取得的令人鼓舞的结果表明，DoubleU-Net可以作为医学图像分割和跨数据集评估测试的强大基线模型，用于衡量深度学习（Deep Learning, DL）模型的泛化能力。

源 PDF