LadderNet : Réseaux multi-chemins basés sur U-Net pour la segmentation d'images médicales

U-Net fournit des performances de pointe dans de nombreux problèmes de segmentation d'images médicales. De nombreuses modifications ont été proposées pour U-Net, telles que l'attention U-Net, le U-Net à convolutions résiduelles récurrentes (R2-UNet) et le U-Net avec des blocs résiduels ou des blocs à connexions denses. Cependant, toutes ces modifications présentent une structure encodeur-décodeur avec des connexions de saut, et le nombre de chemins pour le flux d'information est limité. Dans cet article, nous proposons LadderNet, qui peut être considéré comme une chaîne de plusieurs U-Nets. Au lieu d'avoir une seule paire de branches encodeur et décodeur comme dans U-Net, un LadderNet possède plusieurs paires de branches encodeur-décodeur, avec des connexions de saut entre chaque paire de branches décodeuses adjacentes à chaque niveau. Inspirés par le succès de ResNet et R2-UNet, nous utilisons des blocs résiduels modifiés où les deux couches de convolution dans un bloc partagent les mêmes poids. Grâce aux connexions de saut et aux blocs résiduels, un LadderNet offre plus de chemins pour le flux d'information et peut être vu comme un ensemble de Réseaux Convolutifs Complètement (FCN). Cette équivalence à un ensemble de FCNs améliore la précision de la segmentation tout en réduisant le nombre de paramètres grâce aux poids partagés au sein de chaque bloc résiduel. La segmentation sémantique est essentielle pour la détection des maladies rétiniennes. Nous avons testé LadderNet sur deux jeux de données基准数据集 (benchmark datasets) pour la segmentation des vaisseaux sanguins dans les images rétiniennes, et avons obtenu des performances supérieures aux méthodes décrites dans la littérature. L'implémentation est disponible à l'adresse \url{https://github.com/juntang-zhuang/LadderNet}注:在翻译中,“基准数据集”被标记为“benchmark datasets”,以确保信息完整。