3 个月前

FCB-SwinV2 Transformer 用于息肉分割

Kerr Fitzgerald, Bogdan Matuszewski
FCB-SwinV2 Transformer 用于息肉分割
摘要

在结肠镜视频帧中利用深度学习模型进行息肉分割,有望实现临床工作流程的自动化,从而有助于提高息肉的早期检出率及其特征识别,进而预防其发展为结直肠癌。近年来,最先进的深度学习息肉分割模型通常将全卷积网络(Fully Convolutional Network, FCN)架构与Transformer网络架构的输出并行融合。本文针对当前最先进的息肉分割模型FCBFormer提出改进方案:将原模型中的Transformer架构替换为SwinV2 Transformer-UNET,并对全卷积网络架构进行小幅调整,从而构建出新型模型FCB-SwinV2 Transformer。该模型在广泛使用的结肠镜图像分割基准数据集Kvasir-SEG和CVC-ClinicDB上进行了性能评估,并进一步开展了泛化能力测试。实验结果表明,FCB-SwinV2 Transformer在所有测试中均能稳定获得更高的平均Dice系数(mDice),展现出新的最先进性能。此外,本文还指出了当前文献中结肠镜息肉分割模型评估方法存在的若干问题,并进行了讨论。其中最为关键的问题是:在对CVC-ClinicDB数据集进行性能评估时,应确保训练、验证与测试数据划分过程中不发生视频序列之间的数据泄露(data leakage),以保证评估结果的科学性与可靠性。