
摘要
医学图像分割是满足多种临床需求的前提,近年来得益于卷积神经网络(CNN)的快速发展而取得了显著进展。然而,现有方法在建模显式的长距离依赖关系方面仍存在普遍局限性;而现有解决方案通常依赖于构建深层编码器并采用激进的下采样操作,这不仅导致网络结构冗余加深,还造成局部细节信息的丢失。因此,医学图像分割任务亟需一种更优的解决方案,在高效建模全局上下文信息的同时,仍能有效保留低层细节特征。本文提出一种新型的分支并行架构——TransFuse,以应对这一挑战。TransFuse 采用并行方式融合 Transformer 与 CNN,能够在显著更浅的网络结构中高效捕获全局依赖关系与低层空间细节。此外,本文设计了一种新颖的融合机制——BiFusion 模块,用于高效融合来自两个分支的多层级特征。大量实验表明,TransFuse 在包括息肉、皮肤病变、髋关节及前列腺在内的多种二维与三维医学图像分割任务中均取得了当前最优的性能表现,同时显著减少了模型参数量并提升了推理速度。