Alignement bidimensionnel des caractéristiques pour la détection d'objets multi-domaines

Récemment, le problème de la détection d'objets à travers les domaines a commencé à attirer l'attention au sein de la communauté de vision par ordinateur. Dans cet article, nous proposons un nouveau modèle non supervisé pour la détection d'objets à travers les domaines, qui exploite les données annotées d'un domaine source afin d'entraîner un détecteur d'objets pour un domaine cible différent. Le modèle proposé réduit la divergence de représentation entre les domaines pour la détection d'objets en réalisant un alignement de caractéristiques à travers les domaines selon deux dimensions : la dimension profonde (en profondeur des couches de canaux) et la dimension spatiale. Dans la dimension profonde, au niveau des couches de canaux, il utilise les informations inter-canaux pour atténuer la divergence entre domaines en assurant un alignement des styles d'images. Dans la dimension spatiale, il met en œuvre des modules d'attention spatiale afin d'intensifier les régions pertinentes à la détection et de supprimer les régions non pertinentes, dans le cadre de l'alignement des caractéristiques à travers les domaines. Des expérimentations ont été menées sur plusieurs jeux de données standards pour la détection d'objets à travers les domaines. Les résultats expérimentaux montrent que la méthode proposée surpasser les méthodes de référence les plus avancées.