Détection d'objets adaptative avec prédiction multilabel double

Dans cet article, nous proposons un nouveau modèle de adaptation de domaine profonde non supervisée, entièrement end-to-end, pour la détection d’objets adaptative, en exploitant la reconnaissance d’objets à plusieurs étiquettes comme tâche auxiliaire double. Le modèle exploite la prédiction à plusieurs étiquettes afin de révéler les informations relatives aux catégories d’objets présentes dans chaque image, puis utilise ces résultats de prédiction pour réaliser une alignement global des caractéristiques par adversarité conditionnelle, permettant ainsi de traiter la structure multi-modale des caractéristiques d’image afin de réduire la divergence entre domaines au niveau global des caractéristiques tout en préservant leur discriminabilité. En outre, nous introduisons un mécanisme de régularisation par cohérence de prédiction pour soutenir la détection d’objets, qui utilise les résultats de la prédiction à plusieurs étiquettes comme information de régularisation auxiliaire afin d’assurer une découverte cohérente des catégories d’objets entre la tâche de reconnaissance d’objets et celle de détection d’objets. Des expériences ont été menées sur plusieurs jeux de données standards, et les résultats montrent que le modèle proposé surpasser les méthodes de référence les plus avancées.