Un regard plus approfondi sur la détection d'objets co-salients

La détection d'objets saillants co-occurrents (CoSOD) est une branche émergente et en pleine expansion de la détection d'objets saillants (SOD), visant à identifier les objets saillants partagés entre plusieurs images. Toutefois, les jeux de données existants pour CoSOD souffrent souvent d'un biais important : ils supposent que chaque groupe d'images contient des objets saillants présentant des apparences visuelles similaires. Ce biais conduit à des conditions idéales de formation, dont l'efficacité des modèles entraînés sur ces jeux de données peut être compromise dans des situations réelles, où la similarité entre objets est généralement sémantique ou conceptuelle. Pour remédier à ce problème, nous proposons tout d'abord un nouveau jeu de données de haute qualité, nommé CoSOD3k, comprenant 3 316 images réparties en 160 groupes, dotées d'annotations à plusieurs niveaux : catégorie, boîte englobante, objet et instance. CoSOD3k représente une avancée significative en termes de diversité, de difficulté et d'évolutivité, offrant ainsi des bénéfices substantiels aux tâches visuelles connexes. Par ailleurs, nous présentons une synthèse complète de 34 algorithmes de pointe, en évaluant 19 d'entre eux sur quatre jeux de données CoSOD existants (MSRC, iCoSeg, Image Pair et CoSal2015) ainsi que sur notre CoSOD3k, sur un ensemble total de 61 000 images (plus grand échelle jamais atteint), avec une analyse des performances au niveau des groupes. Enfin, nous discutons des défis actuels et des perspectives futures pour CoSOD. Cette étude devrait constituer un puissant moteur de croissance pour la communauté CoSOD. La boîte à outils de benchmark et les résultats sont disponibles sur notre page de projet.