HyperAIHyperAI
il y a 11 jours

Chercher des similarités plutôt que des différences : alignement de domaine basé sur la similarité pour la détection d'objets adaptative

Farzaneh Rezaeianaran, Rakshith Shetty, Rahaf Aljundi, Daniel Olmeda Reino, Shanshan Zhang, Bernt Schiele
Chercher des similarités plutôt que des différences : alignement de domaine basé sur la similarité pour la détection d'objets adaptative
Résumé

Afin de déployer de manière robuste des détecteurs d’objets dans une large variété de scénarios, il est essentiel qu’ils soient capables de s’adapter aux changements de distribution des données d’entrée sans nécessiter une annotation continue de nouveaux jeux de données. Cette contrainte a motivé de nombreuses recherches sur les algorithmes d’adaptation de domaine non supervisée (Unsupervised Domain Adaptation, UDA) pour la détection d’objets. Les méthodes UDA visent à apprendre à passer d’un domaine source étiqueté vers un domaine cible non étiqueté, en imposant une alignement entre les caractéristiques extraites par le détecteur dans les deux domaines. Toutefois, il n’existe pas encore de consensus sur lesquelles caractéristiques doivent être alignées ni sur la manière de procéder à cet alignement. Dans notre travail, nous proposons un cadre général qui synthétise les composants couramment utilisés dans les méthodes UDA, ouvrant ainsi la voie à une analyse approfondie de l’espace de conception des méthodes UDA. Plus précisément, nous introduisons un nouvel algorithme UDA, ViSGA, qui constitue une implémentation directe de notre cadre, tirant parti des meilleures choix de conception et introduisant une méthode simple mais efficace pour agréger les caractéristiques au niveau des instances, basée sur la similarité visuelle, avant d’appliquer un alignement par groupe via une formation adversaire. Nous démontrons que l’agrégation fondée sur la similarité et l’entraînement adversaire permettent à notre modèle de se concentrer sur un alignement grossier des groupes de caractéristiques, sans être contraint de faire correspondre toutes les instances entre des domaines faiblement alignés. Enfin, nous examinons la faisabilité de ViSGA dans un cadre où les données étiquetées proviennent de sources multiples. Les expérimentations montrent que non seulement notre méthode surpasser les approches précédentes à source unique sur les scénarios Sim2Real et Weather Adverse, mais qu’elle se généralise également efficacement au cadre multi-source.

Chercher des similarités plutôt que des différences : alignement de domaine basé sur la similarité pour la détection d'objets adaptative | Articles de recherche récents | HyperAI