Réseau Guidé par une Représentation à Échelle Complète pour la Segmentation des Vaisseaux Rétiniens

L'architecture U-Net et ses variantes sont restées à l'état de l'art (SOTA) pour la segmentation des vaisseaux rétiniens au cours de la dernière décennie. Dans cette étude, nous présentons un réseau guidé à échelle complète (FSG-Net), où le réseau de représentation des caractéristiques, doté de blocs de convolution modernisés, extrait des informations à échelle complète, tandis que le bloc de convolution guidé affine ces informations. Un filtre guidé par l'attention est introduit dans le bloc de convolution guidé, en interprétant que ce filtre se comporte comme un filtre masque non flou (unsharp mask filter). La transmission d'informations à échelle complète au bloc d'attention permet la génération de cartes d'attention améliorées, qui sont ensuite transmises au filtre guidé par l'attention, entraînant une amélioration des performances du réseau de segmentation. La structure précédant le bloc de convolution guidé peut être remplacée par n'importe quelle variante U-Net, ce qui renforce la scalabilité de l'approche proposée. Pour une comparaison équitable, nous avons reimplémenté des études récentes disponibles dans des dépôts publics afin d'évaluer leur scalabilité et leur reproductibilité. Nos expériences montrent également que le réseau proposé présente des résultats compétitifs par rapport aux modèles SOTA actuels sur divers jeux de données publics. Les études d'ablation démontrent que le modèle proposé est compétitif avec des tailles de paramètres beaucoup plus petites. Enfin, en appliquant le modèle proposé à la segmentation des rides faciales, nous avons confirmé son potentiel pour être adapté à des tâches similaires dans d'autres domaines. Notre code est disponible sur https://github.com/ZombaSY/FSG-Net-pytorch.