DC-UNet : Repenser l'architecture U-Net grâce à un CNN efficace à deux canaux pour la segmentation d'images médicales

Récemment, l'apprentissage profond est devenu beaucoup plus populaire dans le domaine de la vision par ordinateur. Le réseau de neurones convolutifs (CNN) a permis une avancée majeure dans les tâches de segmentation d’images, en particulier pour les images médicales. À cet égard, U-Net constitue l’approche dominante pour la segmentation d’images médicales. Non seulement U-Net se distingue par ses performances dans la segmentation d’images médicales multimodales, mais il s’avère également efficace dans des cas particulièrement difficiles. Toutefois, nous avons constaté que l’architecture classique de U-Net présente certaines limitations sur plusieurs aspects. Ainsi, nous avons apporté des modifications : 1) conception d’une architecture CNN efficace pour remplacer à la fois le module encodeur et le décodeur ; 2) intégration d’un module résiduel à la place des connexions de saut (skip connections) entre l’encodeur et le décodeur, afin d’améliorer le modèle U-Net de pointe. Suite à ces améliorations, nous avons conçu une nouvelle architecture — DC-UNet — en tant que candidat potentiel pour succéder à l’architecture U-Net. Nous avons développé une nouvelle architecture CNN efficace, puis construit DC-UNet sur cette base. Nous avons évalué notre modèle sur trois jeux de données comportant des cas complexes, obtenant respectivement des améliorations relatives de performance de 2,90 %, 1,49 % et 11,42 % par rapport à U-Net classique. En outre, nous avons utilisé la similarité de Tanimoto pour remplacer la similarité de Jaccard dans les comparaisons d’images en niveaux de gris.