Diversifier et Apparier : Un Paradigme d'Apprentissage de Représentations Adaptatif aux Domaines pour la Détection d'Objets

Nous présentons une nouvelle approche d'adaptation de domaine non supervisée pour la détection d'objets. Notre objectif est de résoudre simultanément le problème de traduction imparfaite au niveau des pixels et le problème de discrimination biaisée par la source au niveau des caractéristiques. Notre méthode se compose de deux étapes : Diversification de Domaine (DD) et Apprentissage de Représentations Invariantes Multidomaines (MRL). À l'étape DD, nous diversifions la distribution des données étiquetées en générant divers domaines distincts et décalés à partir du domaine source. À l'étape MRL, nous appliquons un apprentissage antagoniste avec un discriminateur multidomaine pour encourager les caractéristiques à être indiscernables entre les différents domaines. La DD atténue la discrimination biaisée par la source, tandis que la MRL réduit la traduction imparfaite des images.Nous construisons un cadre structuré d'adaptation de domaine pour notre paradigme d'apprentissage et introduisons une méthode pratique de DD pour sa mise en œuvre. Notre méthode surpasse les méthodes de pointe actuelles avec une marge importante de 3% à 11% en termes de précision moyenne (mAP) sur divers jeux de données.