17 天前
Focal-UNet:用于医学图像分割的类UNet焦点调制
MohammadReza Naderi, MohammadHossein Givkashi, Fatemeh Piri, Nader Karimi, Shadrokh Samavi

摘要
近年来,许多研究尝试构建基于Transformer的U型架构,并提出了若干超越传统CNN方法的新模型。然而,由于Transformer固有的图像分块(patch partitioning)操作,预测掩码中仍存在严重的块状伪影和裁剪边缘等问题。针对这一挑战,本文提出了一种新型U型架构,用于医学图像分割,其核心是引入了最新的焦点调制(focal modulation)机制。所提出的架构在编码器与解码器之间采用非对称深度设计。得益于焦点模块对局部与全局特征的高效聚合能力,该模型能够同时兼顾Transformer的宽感受野优势与CNN的局部感知特性。这一设计使得所提方法在局部与全局特征的利用之间实现了更优平衡,从而在性能上超越了当前最强大的基于Transformer的U型模型之一——Swin-UNet。在Synapse数据集上,我们的方法实现了1.68%更高的DICE分数和0.89更优的HD(Hausdorff Distance)指标;在数据极度有限的NeoPolyp数据集上,DICE分数亦提升了4.25%。相关代码已开源,可访问:https://github.com/givkashi/Focal-UNet