G-CASCADE : Décodage efficace par convolution graphique en cascade pour la segmentation d'images médicales 2D

Ces dernières années, le segment de l'imagerie médicale est devenu une application importante dans le domaine du diagnostic assisté par ordinateur. Dans cet article, nous proposons pour la première fois un nouveau décodeur basé sur la convolution de graphe, nommé Décodeur d'Attention par Convolution de Graphe en Cascade (G-CASCADE), pour le segment de l'imagerie médicale 2D. Le G-CASCADE affine progressivement les cartes de caractéristiques multi-étages générées par des encodeurs transformateurs hiérarchiques à l'aide d'un bloc de convolution de graphe efficace. L'encodeur utilise le mécanisme d'auto-attention pour capturer les dépendances à longue portée, tandis que le décodeur affine les cartes de caractéristiques tout en préservant les informations à longue portée grâce aux champs récepteurs globaux du bloc de convolution de graphe. Des évaluations rigoureuses de notre décodeur avec plusieurs encodeurs transformateurs sur cinq tâches de segmentation d'images médicales (à savoir, organes abdominaux, organes cardiaques, lésions polypaires, lésions cutanées et vaisseaux rétiniens) montrent que notre modèle surpassent les autres méthodes d'avant-garde (state-of-the-art, SOTA). Nous démontrons également que notre décodeur obtient des scores DICE supérieurs à ceux du décodeur CASCADE d'avant-garde avec 80,8 % moins de paramètres et 82,3 % moins d'opérations flottantes (FLOPs). Notre décodeur peut facilement être utilisé avec d'autres encodeurs hiérarchiques pour des tâches générales de segmentation sémantique et médicale.