HistoSeg : Une attention rapide avec fonction de perte multipliée pour la segmentation de structures multiples dans les images histologiques numériques

La segmentation d’images médicales contribue au diagnostic assisté par ordinateur, aux interventions chirurgicales et aux traitements. Les images numérisées de lames tissulaires sont utilisées pour analyser et segmenter des glandes, des noyaux et d’autres biomarqueurs, qui sont ensuite intégrés dans des applications médicales assistées par ordinateur. À cet effet, de nombreux chercheurs ont développé divers réseaux neuronaux pour effectuer la segmentation sur des images histologiques, la plupart reposant sur une architecture encodeur-décodeur et intégrant des modules d’attention complexes ou des architectures de type transformer. Toutefois, ces réseaux peinent à capturer efficacement à la fois les caractéristiques locales et globales, tout en assurant une détection précise des frontières à plusieurs échelles. Ainsi, nous proposons un réseau encodeur-décodeur, un module d’attention rapide (Quick Attention Module) ainsi qu’une fonction de perte multi-objectif combinant la perte d’entropie croisée binaire (BCE), la perte focalisée (Focal Loss) et la perte de Dice (Dice Loss). Nous évaluons la capacité de généralisation de notre réseau proposé sur deux jeux de données publics pour la segmentation d’images médicales : MoNuSeg et GlaS. Nos résultats dépassent les méthodes de pointe, avec une amélioration de 1,99 % sur le jeu de données MoNuSeg et de 7,15 % sur GlaS. Le code d’implémentation est disponible à l’adresse suivante : https://bit.ly/HistoSeg