Meta-Polyp : une base pour une segmentation efficace des polypes

Ces dernières années, la segmentation des polypes a acquis une importance croissante, et de nombreuses méthodes ont été développées en utilisant des réseaux de neurones convolutifs (CNN), des Vision Transformers et des architectures Transformer afin d’obtenir des résultats compétitifs. Toutefois, ces approches rencontrent fréquemment des difficultés face à des jeux de données hors distribution, à des contours manquants ou à des polypes de petite taille. En 2022, Meta-Former a été introduit comme une nouvelle base de référence pour la vision par ordinateur, améliorant non seulement les performances des tâches multiples en vision par ordinateur, mais aussi en surmontant les limites des architectures de base Vision Transformer et CNN. Afin d’améliorer davantage la segmentation, nous proposons une fusion de Meta-Former avec UNet, accompagnée de l’introduction d’un bloc d’upsampling multi-échelle intégrant une combinaison par niveau dans la phase de décodage, afin d’améliorer la qualité texturelle. Par ailleurs, nous introduisons le bloc Convformer, inspiré du concept de Meta-Former, pour renforcer l’information cruciale des caractéristiques locales. Ces blocs permettent de combiner efficacement les informations globales — telles que la forme générale du polype — avec les informations locales et les détails de contour, ce qui est essentiel pour la prise de décision en segmentation médicale. L’approche proposée a atteint des performances compétitives et obtenu le meilleur résultat de l’état de l’art sur les jeux de données CVC-300, Kvasir et CVC-ColonDB. Hormis Kvasir-SEG, les autres jeux de données sont hors distribution. Le code source est disponible à l’adresse suivante : https://github.com/huyquoctrinh/MetaPolyp-CBMS2023.