Adaptation des détecteurs d'objets par normalisation de domaine conditionnelle

Les détecteurs d’objets du monde réel sont fréquemment confrontés aux écarts de domaine entre différents jeux de données. Dans ce travail, nous proposons une méthode appelée Normalisation de domaine conditionnelle (Conditional Domain Normalization, CDN) afin de réduire cet écart de domaine. CDN est conçue pour encoder différentes entrées de domaine dans un espace latente partagé, où les caractéristiques issues de différents domaines portent la même information attributaire de domaine. Pour atteindre cet objectif, nous commençons par séparer, à partir des caractéristiques sémantiques d’un domaine donné, les attributs spécifiques à ce domaine grâce à un module d’encodage de domaine, qui apprend un vecteur de domaine représentant l’information attributaire correspondante. Ce vecteur de domaine est ensuite utilisé pour normaliser conditionnellement les caractéristiques d’un autre domaine, de manière à ce que les caractéristiques issues de différents domaines portent désormais la même attribut de domaine. Nous intégrons CDN dans diverses étapes de convolution d’un détecteur d’objets, afin de traiter de manière adaptative les décalages de domaine présents aux différents niveaux de représentation. Contrairement aux méthodes existantes qui réalisent une apprentissage de confusion de domaine sur les caractéristiques sémantiques afin d’éliminer les facteurs spécifiques à un domaine, CDN aligne les distributions de différents domaines en modulant les caractéristiques sémantiques d’un domaine en fonction du vecteur de domaine appris à partir d’un autre domaine. Des expérimentations étendues montrent que CDN surpasse significativement les méthodes existantes sur des benchmarks d’adaptation réel à réel et synthétique à réel, couvrant à la fois la détection d’images 2D et la détection de nuages de points 3D.