UDA-COPE : Adaptation non supervisée de domaine pour l'estimation de la pose d'objets par catégorie

L'apprentissage de l'estimation de la pose d'objets nécessite souvent des étiquettes de vérité terrain (GT), telles que les modèles CAD et la pose d'objets à l'échelle absolue, qui sont coûteuses et fastidieuses à obtenir dans le monde réel. Pour résoudre ce problème, nous proposons une adaptation non supervisée de domaine (UDA) pour l'estimation de la pose d'objets au niveau catégoriel, appelée UDA-COPE. Inspirée par les techniques récentes d'UDA multimodale, la méthode proposée utilise un schéma d'apprentissage auto-supervisé basé sur un réseau enseignant-étudiant pour former un réseau d'estimation de pose sans utiliser les étiquettes de pose du domaine cible. Nous introduisons également une méthode de filtrage bidirectionnel entre la carte d'espace de coordonnées normalisées prédites (NOCS) et le nuage de points observé, afin non seulement de rendre notre réseau enseignant plus robuste face au domaine cible, mais aussi de fournir des étiquettes pseudo plus fiables pour l'entraînement du réseau étudiant. Des résultats expérimentaux approfondis démontrent l'efficacité de notre méthode proposée tant quantitativement que qualitativement. Notamment, sans recourir aux étiquettes GT du domaine cible, notre méthode proposée a atteint des performances comparables ou même supérieures à celles des méthodes existantes qui dépendent des étiquettes GT.