Attention U-Net : Apprendre où regarder pour le pancréas

Nous proposons un nouveau modèle de porte d'attention (Attention Gate, AG) pour l'imagerie médicale qui apprend automatiquement à se concentrer sur des structures cibles de formes et de tailles variées. Les modèles entraînés avec des AGs apprennent implicitement à supprimer les régions non pertinentes dans une image d'entrée tout en mettant en évidence les caractéristiques saillantes utiles pour une tâche spécifique. Cela nous permet d'éliminer la nécessité d'utiliser des modules explicites de localisation externe des tissus/organs dans les réseaux neuronaux convolutifs (CNNs) en cascade. Les AGs peuvent être facilement intégrés dans des architectures de CNN standards telles que le modèle U-Net, avec un surcoût computationnel minimal tout en augmentant la sensibilité du modèle et la précision des prédictions. L'architecture proposée, Attention U-Net, est évaluée sur deux grands ensembles de données IRM abdominales pour la segmentation d'images multi-classes. Les résultats expérimentaux montrent que les AGs améliorent constamment les performances prédictives du U-Net sur différents ensembles de données et tailles d'entraînement tout en préservant l'efficacité computationnelle. Le code de l'architecture proposée est disponible au public.