Command Palette
Search for a command to run...
Extraction informative et cohérente de correspondances pour la détection d'objets faiblement supervisée à travers des domaines
Extraction informative et cohérente de correspondances pour la détection d'objets faiblement supervisée à travers des domaines
Jia Li Kui Fu Yu Zhang Luwei Hou
Résumé
La détection d'objets faiblement supervisée à travers des domaines vise à adapter les connaissances au niveau des objets issues d’un ensemble de données de domaine source entièrement annoté (c’est-à-dire doté de boîtes englobantes d’objets) afin d’entraîner des détecteurs d’objets pour des domaines cibles faiblement annotés (c’est-à-dire munis uniquement d’étiquettes au niveau de l’image). Contrairement à l’approche couramment utilisée dans la littérature, qui repose sur un alignement des distributions au niveau du domaine, nous proposons d’apprendre des correspondances pixel-par-pixel entre domaines afin d’assurer un transfert de connaissances plus précis. Cette idée est mise en œuvre grâce à un nouveau schéma de co-attention cross-domain, entraîné comme un mécanisme de compétition régionale. Dans ce cadre, le module de correspondance cross-domain cherche à identifier des caractéristiques informatives sur l’image du domaine cible, lesquelles, une fois projetées (warped) sur l’image du domaine source, permettent d’expliquer au mieux ses annotations. Parallèlement, un générateur de masques collaboratif participe à la compétition en masquant les régions pertinentes de l’image cible, afin de rendre les caractéristiques restantes non informatives. Ce mécanisme d’apprentissage compétitif vise à établir une corrélation complète entre les régions de premier plan dans les paires d’images cross-domain, révélant ainsi avec précision l’étendue réelle des objets dans le domaine cible. Pour atténuer l’ambiguïté liée à l’apprentissage des correspondances inter-domaines, nous proposons également un régulariseur de cohérence cyclique au sein du domaine, qui exploite les correspondances intra-domaines, généralement plus fiables. L’approche proposée obtient des améliorations significatives et constantes par rapport aux méthodes existantes, comme le démontrent les expérimentations menées sur diverses bases de données.