UNet 3+ : UNet entièrement connectée à grande échelle pour la segmentation d’images médicales

Récemment, un intérêt croissant s’est manifesté envers la segmentation sémantique basée sur le deep learning. UNet, l’un des réseaux de deep learning reposant sur une architecture encodeur-décodeur, est largement utilisé pour la segmentation d’images médicales. La combinaison des caractéristiques à plusieurs échelles constitue l’un des facteurs clés pour une segmentation précise. UNet++ a été développé comme une version améliorée d’UNet, en introduisant une architecture à connexions sautées imbriquées et denses. Toutefois, cette approche ne tire pas pleinement parti de l’information disponible à toutes les échelles, laissant encore une importante marge d’amélioration. Dans cet article, nous proposons un nouveau modèle, UNet 3+, qui exploite à la fois des connexions sautées à échelle complète et une supervision profonde. Les connexions sautées à échelle complète permettent d’intégrer des détails de bas niveau avec des informations sémantiques de haut niveau provenant des cartes de caractéristiques à différentes échelles ; quant à la supervision profonde, elle permet d’apprendre des représentations hiérarchiques à partir des cartes de caractéristiques agrégées à toutes les échelles. La méthode proposée s’avère particulièrement bénéfique pour les organes apparaissant à des échelles variables. En plus d’améliorer la précision, UNet 3+ permet de réduire le nombre de paramètres du réseau, améliorant ainsi l’efficacité computationnelle. Nous proposons également une fonction de perte hybride et un module guidé par classification afin d’améliorer la précision des contours des organes et de réduire la sur-segmentation dans les régions non organiques, aboutissant à des résultats de segmentation plus précis. L’efficacité de la méthode proposée est démontrée sur deux jeux de données. Le code source est disponible à l’adresse suivante : github.com/ZJUGiveLab/UNet-Version