Domain Adaptive Faster R-CNN pour la détection d'objets en milieu naturel

La détection d'objets suppose généralement que les données d'entraînement et de test sont tirées d'une distribution identique, ce qui n'est cependant pas toujours le cas en pratique. Un tel écart de distribution entraîne une baisse significative des performances. Dans cette étude, nous visons à améliorer la robustesse inter-domaines de la détection d'objets. Nous abordons le décalage de domaine sur deux niveaux : 1) le décalage au niveau des images, comme le style des images, l'éclairage, etc., et 2) le décalage au niveau des instances, comme l'apparence des objets, leur taille, etc.Notre approche est basée sur le modèle récent et de pointe Faster R-CNN, et nous concevons deux composants d'adaptation de domaine, au niveau des images et au niveau des instances, pour réduire les écarts de domaine. Ces deux composants d'adaptation de domaine s'appuient sur la théorie de la H-divergence et sont mis en œuvre par l'apprentissage d'un classifieur de domaine dans un cadre d'entraînement antagoniste (adversarial training). Les classifieurs de domaine à différents niveaux sont renforcés par une régularisation de cohérence pour apprendre un réseau de proposition de régions (region proposal network, RPN) invariant aux domaines dans le modèle Faster R-CNN.Nous évaluons notre nouvelle approche proposée à l'aide de plusieurs jeux de données, notamment Cityscapes, KITTI, SIM10K, etc. Les résultats montrent l'efficacité de notre approche proposée pour une détection d'objets robuste dans divers scénarios de décalage inter-domaines.