RSAFormer : une méthode de segmentation de polypes basée sur le transformateur à attention auto-régionale
La coloscopie revêt une importance capitale dans le dépistage précoce et le diagnostic clinique du cancer colorectal. La segmentation fine des polypes demeure toutefois un défi difficile à relever. En effet, les modèles les plus avancés actuellement disponibles présentent encore des capacités de segmentation limitées, en raison du manque de frontières claires et fortement similaires entre les tissus sains et les polypes. Pour relever ce problème, nous proposons un réseau d’amélioration par attention auto-encodée régionale (RSAFormer), basé sur un encodeur Transformer, afin de capturer des caractéristiques plus robustes. Contrairement aux méthodes performantes existantes, RSAFormer utilise de manière originale une architecture à double décodeur pour générer diverses cartes de caractéristiques, offrant ainsi une plus grande flexibilité et une précision accrue dans l’extraction des caractéristiques, en comparaison avec les approches classiques reposant sur un seul décodeur. De plus, RSAFormer intègre un module d’amélioration par attention auto-encodée régionale (RSA), permettant d’obtenir des informations de caractéristiques plus précises et de renforcer l’interaction entre les caractéristiques de basse et de haute niveau. Ce module améliore particulièrement les zones incertaines afin d’extraire des informations plus précises sur les frontières, ces zones étant définies par leur contexte régional. Des expériences étendues ont été menées sur cinq jeux de données populaires de polypes, démontrant ainsi la compétence de RSAFormer. Celui-ci atteint un score moyen de Dice de 92,2 % sur Kvasir et de 83,5 % sur ETIS, surpassant la plupart des modèles de pointe actuels.