HyperAIHyperAI
il y a 3 mois

FCB-SwinV2 Transformer pour la segmentation des polypes

Kerr Fitzgerald, Bogdan Matuszewski
FCB-SwinV2 Transformer pour la segmentation des polypes
Résumé

La segmentation des polypes dans les images de vidéos de coloscopie à l’aide de modèles d’apprentissage profond a le potentiel d’automatiser le flux de travail des cliniciens. Cela pourrait contribuer à améliorer le taux de détection précoce et la caractérisation des polypes susceptibles de évoluer vers un cancer colorectal. Les modèles récents d’état de l’art pour la segmentation des polypes basés sur l’apprentissage profond combinent les sorties d’architectures de Réseaux Convolutionnels Entièrement Connectés (Fully Convolutional Networks, FCN) et d’architectures de Transformateurs (Transformer Networks), opérant en parallèle. Dans cet article, nous proposons des modifications au modèle d’état de l’art actuel pour la segmentation des polypes, le FCBFormer. L’architecture de Transformateur du FCBFormer est remplacée par un SwinV2 Transformer-UNET, tandis que des ajustements mineurs sont apportés à l’architecture FCN afin de concevoir le modèle FCB-SwinV2 Transformer. La performance du FCB-SwinV2 Transformer est évaluée sur les jeux de données populaires de benchmarking pour la segmentation en coloscopie, à savoir Kvasir-SEG et CVC-ClinicDB. Des tests de généralisation sont également réalisés. Le FCB-SwinV2 Transformer parvient à atteindre de manière cohérente des scores mDice supérieurs dans toutes les évaluations effectuées, représentant ainsi une nouvelle performance d’état de l’art. Des problèmes identifiés concernant la manière dont la performance des modèles de segmentation en coloscopie est évaluée dans la littérature sont également rapportés et discutés. L’un des problèmes les plus importants soulignés est que, lors de l’évaluation sur le jeu de données CVC-ClinicDB, il serait préférable de garantir l’absence de fuite de données provenant de séquences vidéo au cours de la partition des données d’entraînement, de validation et de test.