2 个月前
UGCANet:一种用于内窥镜图像分析的统一全局上下文感知Transformer网络与特征对齐方法
Pham Vu Hung; Nguyen Duy Manh; Nguyen Thi Oanh; Nguyen Thi Thuy; Dinh Viet Sang

摘要
胃肠内镜是一种利用装有摄像头和其他仪器的柔性管来检查消化道的医疗程序。这种微创技术可以用于诊断和管理多种胃肠道疾病,包括炎症性肠病、胃肠道出血和结肠癌。在上消化道早期发现和识别病变,以及识别可能具有癌症发展风险的恶性息肉,是胃肠内镜诊断和治疗应用中的关键组成部分。因此,提高胃肠道疾病的检出率可以通过增加及时医疗干预的可能性显著改善患者的预后,这不仅可能延长患者的生命,还能改善其整体健康状况。本文提出了一种基于Transformer的新型深度神经网络,该网络设计为同时执行多个任务,从而能够准确识别上消化道病变和结肠息肉。我们的方法引入了一个独特的全局上下文感知模块,并利用强大的MiT主干网(MiT backbone)及特征对齐块(feature alignment block),以增强网络的表征能力。这一创新设计在各种内镜诊断任务中显著提升了性能。广泛的实验结果表明,我们的方法相比其他最先进方法表现出优越的性能。