Adaptation de domaine symétrique prenant en compte la géométrie pour l’estimation de profondeur monoculaire

L'estimation supervisée de la profondeur a atteint une grande précision grâce aux architectures avancées de réseaux profonds. Étant donné que les étiquettes de profondeur véritables sont difficiles à obtenir, les méthodes récentes tentent d'apprendre des réseaux d'estimation de profondeur de manière non supervisée en explorant des indices non supervisés, qui sont efficaces mais moins fiables que les vraies étiquettes. Une approche émergente pour résoudre ce dilemme consiste à transférer des connaissances à partir d'images synthétiques dotées d'étiquettes de profondeur véritables via des techniques d'adaptation de domaine. Cependant, ces approches négligent la structure géométrique spécifique des images naturelles dans le domaine cible (c'est-à-dire les données réelles), ce qui est crucial pour une prédiction de profondeur performante. Guidés par cette observation, nous proposons un cadre d'adaptation de domaine symétrique sensible à la géométrie (GASDA) pour explorer conjointement les étiquettes dans les données synthétiques et la géométrie épipolaire dans les données réelles. De plus, en entraînant deux traducteurs de style d'image et deux estimateurs de profondeur symétriquement au sein d'un réseau bout-en-bout, notre modèle réalise un meilleur transfert de style d'image et génère des cartes de profondeur de haute qualité. Les résultats expérimentaux démontrent l'efficacité de notre méthode proposée ainsi qu'une performance comparable à celle des méthodes les plus avancées. Le code sera rendu publiquement disponible sur : https://github.com/sshan-zhao/GASDA.