摘要
结肠镜检查在结肠癌的早期筛查与临床诊断中具有重要意义。然而,实现息肉的精细分割仍是一项具有挑战性的任务,主要原因在于正常组织与息肉之间缺乏清晰且高度相似的边界特征。为应对这一难题,本文提出一种基于Transformer编码器的区域自注意力增强网络(Region Self-Attention Enhancement Network, RSAFormer),以提取更具鲁棒性的特征表示。与现有优秀方法不同,RSAFormer创新性地采用双解码器结构,能够生成多样化的特征图,在特征提取过程中展现出更高的灵活性与细节表达能力。此外,该网络引入了区域自注意力增强模块(Region Self-Attention Enhancement Module, RSA),有效获取更精确的特征信息,并强化了低层与高层特征之间的交互能力。该模块通过利用区域上下文信息,对边界模糊或不确定性较高的区域进行增强,从而更精准地捕捉息肉的边界特征。在五个主流息肉数据集上开展的大量实验表明,RSAFormer表现出优异的分割性能:在Kvasir数据集上达到92.2%的平均Dice系数,在ETIS数据集上达到83.5%的平均Dice系数,显著优于多数现有先进模型。