Portailage de contexte multi-niveaux du savoir collectif intégré pour la segmentation d’images médicales

La segmentation d’images médicales reste un défi majeur en raison de la grande variabilité anatomique entre les cas. Les progrès récents dans les architectures d’apprentissage profond ont permis d’obtenir des performances plus rapides et plus précises en segmentation d’images. Parmi les réseaux existants, U-Net s’est avéré particulièrement efficace pour la segmentation d’images médicales. Dans ce travail, nous proposons une extension de U-Net pour la segmentation d’images médicales, exploitant pleinement les avantages de U-Net, des blocs Squeeze and Excitation (SE), d’un ConvLSTM bidirectionnel (BConvLSTM) ainsi que du mécanisme de convolution dense. (I) Nous améliorons la performance de segmentation en intégrant des modules SE dans U-Net, avec un impact négligeable sur la complexité du modèle. Ces blocs recalibrent de manière adaptative les réponses des caractéristiques par canal en exploitant un mécanisme d’auto-gating fondé sur l’information globale intégrée aux cartes de caractéristiques. (II) Afin de renforcer la propagation des caractéristiques et d’encourager leur réutilisation, nous utilisons des connexions convolutionnelles denses dans la dernière couche convolutive du chemin d’encodage. (III) Contrairement à une simple concaténation dans les connexions skip de U-Net, nous employons un BConvLSTM à tous les niveaux du réseau pour combiner de manière non linéaire les cartes de caractéristiques extraites du chemin d’encodage correspondant et celles issues de la couche de décodage précédente, après une opération d’up-convolution. Le modèle proposé est évalué sur six jeux de données : DRIVE, ISIC 2017 et 2018, segmentation pulmonaire, $PH^2$ et segmentation des noyaux cellulaires, atteignant des performances de pointe (state-of-the-art).