Apprentissage collaboratif de groupe pour la détection d'objets co-saliens

Nous présentons un nouveau cadre d'apprentissage collaboratif de groupe (GCoNet) capable de détecter des objets co-salistiques en temps réel (16 ms), en exploitant simultanément des représentations de consensus au niveau du groupe basées sur deux critères essentiels :1) la compacité intra-groupe pour mieux formuler la cohérence entre les objets co-salistiques en capturant leurs attributs partagés inhérents grâce à notre nouveau module d'affinité de groupe ;2) la séparabilité inter-groupe pour atténuer efficacement l'influence des objets bruyants sur la sortie en introduisant notre nouveau module de collaboration de groupe conditionnant le consensus incohérent.Pour apprendre un espace d'embedding amélioré sans surcoût computationnel supplémentaire, nous utilisons explicitement une supervision auxiliaire de classification. Des expériences approfondies menées sur trois benchmarks difficiles, à savoir CoCA, CoSOD3k et Cosal2015, montrent que notre GCoNet simple surpasse 10 modèles de pointe et atteint le nouvel état de l'art. Nous illustrons les nouvelles contributions techniques de cet article dans plusieurs applications importantes de vision par ordinateur en aval, notamment la co-segmentation sensible au contenu et la génération automatique de miniatures basée sur la co-localisation.