WaterMask : Segmentations d'instances pour les images sous-marines

La segmentation d'instances d'images sous-marines constitue une étape fondamentale et critique dans l'analyse et la compréhension des images sous-marines. Toutefois, le manque de jeux de données généraux pour la segmentation d'instances multiclasse a freiné le développement de recherches sur la segmentation d'instances dans le domaine des images sous-marines. Dans cet article, nous proposons le premier jeu de données de segmentation d'instances d'images sous-marines (UIIS), comprenant 4 628 images réparties en 7 catégories, toutes annotées au niveau pixel. Par ailleurs, nous introduisons pour la première fois WaterMask, un modèle dédié à la segmentation d'instances d'images sous-marines. Dans WaterMask, nous proposons tout d'abord le module d'attention graphique à similarité de différence (DSGAT), conçu pour restaurer les détails perdus en raison de la dégradation de qualité des images et du sous-échantillonnage, afin d'améliorer la prédiction du réseau. Ensuite, nous introduisons le module de raffinement des caractéristiques à plusieurs niveaux (MFRM), permettant de prédire séparément les masques d'objet principal (foreground) et les masques de contour à l'aide de caractéristiques à différentes échelles, tout en guidant le réseau via la stratégie de masque de contour (BMS) basée sur une fonction de perte d'apprentissage des contours, pour obtenir des résultats de prédiction plus fins. Les résultats expérimentaux étendus montrent que WaterMask atteint des gains significatifs de 2,9 et 3,8 points de mAP par rapport à Mask R-CNN lorsqu'on utilise respectivement ResNet-50 et ResNet-101. Le code source et le jeu de données sont disponibles à l'adresse suivante : https://github.com/LiamLian0727/WaterMask.