3D-PL : Estimation de profondeur adaptative au domaine avec étiquetage pseudo-étiqueté sensible au 3D

Pour l'estimation de profondeur à partir d'une seule vue, l'acquisition de vérités terrain pour des données réelles est difficile, ce qui conduit fréquemment à l'adoption de méthodes d'adaptation de domaine basées sur des données synthétiques étiquetées de manière supervisée. Toutefois, ce type d'approche peut encore entraîner un écart de domaine important en raison du manque de supervision provenant des données réelles. Dans ce travail, nous proposons un cadre d'adaptation de domaine fondé sur la génération de pseudo-vérités terrain fiables en profondeur à partir de données réelles, afin de fournir une supervision directe. Plus précisément, nous introduisons deux mécanismes pour l'étiquetage par pseudo-étiquettes : 1) des pseudo-étiquettes basées sur 2D, obtenues en mesurant la cohérence des prédictions de profondeur lorsque les images présentent le même contenu mais des styles différents ; 2) des pseudo-étiquettes conscientes de la 3D, via un réseau de complétion de nuage de points qui apprend à compléter les valeurs de profondeur dans l'espace 3D, offrant ainsi des informations structurelles plus riches sur la scène, permettant ainsi d'affiner et de générer des pseudo-étiquettes plus fiables. Nos expérimentations montrent que nos méthodes de pseudo-étiquetage améliorent significativement l'estimation de profondeur dans diverses configurations, y compris lors de l'utilisation de paires stéréo pendant l'entraînement. En outre, la méthode proposée se distingue favorablement par rapport à plusieurs approches de pointe d'adaptation de domaine non supervisée sur des jeux de données réels.