HarDNet-MSEG : Un réseau neuronal de segmentation de polypes encodeur-décodeur simple atteignant un Dice moyen supérieur à 0,9 et 86 FPS

Nous proposons un nouveau réseau de neurones convolutifs appelé HarDNet-MSEG pour la segmentation des polypes. Ce modèle atteint l’état de l’art (SOTA) en termes de précision et de vitesse d’inférence sur cinq jeux de données populaires. Sur le jeu de données Kvasir-SEG, HarDNet-MSEG obtient un score moyen de Dice de 0,904 tout en fonctionnant à 86,7 FPS sur une GPU GeForce RTX 2080 Ti. Le modèle se compose d’un bloc principal (backbone) et d’un décodeur. Le bloc principal est un réseau convolutif à faible consommation de bande passante mémoire, nommé HarDNet68, qui a déjà été efficacement appliqué à diverses tâches de vision par ordinateur, notamment la classification d’images, la détection d’objets, le suivi multi-objets et la segmentation sémantique. La partie décodeur s’inspire du Cascaded Partial Decoder, connu pour sa rapidité et sa précision dans la détection d’objets saillants. Nous avons évalué HarDNet-MSEG sur ces cinq jeux de données populaires. Le code source ainsi que tous les détails expérimentaux sont disponibles sur GitHub : https://github.com/james128333/HarDNet-MSEG