EffiSegNet : segmentation de polypes gastro-intestinaux par un réseau basé sur EfficientNet pré-entraîné avec un décodeur simplifié

Ce travail présente EffiSegNet, un nouveau cadre de segmentation reposant sur l’apprentissage par transfert et utilisant un classificateur pré-entraîné à réseau de neurones convolutifs (CNN) comme architecture fondamentale. À la différence des architectures classiques à forme en U symétrique, EffiSegNet simplifie le décodeur et met en œuvre une fusion complète des caractéristiques à l’échelle complète, afin de réduire au minimum le coût computationnel et le nombre de paramètres. Nous avons évalué notre modèle sur la tâche de segmentation des polypes gastro-intestinaux en utilisant le jeu de données public Kvasir-SEG, obtenant des résultats de pointe. Plus précisément, la variante EffiSegNet-B4 atteint un score F1 de 0,9552, un Dice moyen (mDice) de 0,9483, un IoU moyen (mIoU) de 0,9056, une précision de 0,9679 et un rappel de 0,9429, avec un modèle fondamental pré-entraîné — à notre connaissance, les meilleurs scores rapportés dans la littérature pour ce jeu de données. Une formation à partir de zéro a également démontré des performances exceptionnelles par rapport aux travaux antérieurs, atteignant un score F1 de 0,9286, un mDice de 0,9207, un mIoU de 0,8668, une précision de 0,9311 et un rappel de 0,9262. Ces résultats mettent en évidence l’importance d’une conception soignée de l’encodeur dans les réseaux de segmentation d’images ainsi que l’efficacité des approches fondées sur l’apprentissage par transfert.