Régularisation de cohérence pour l’adaptation de domaine non supervisée dans l’estimation de profondeur monoscopique

Dans l’estimation de profondeur à partir d’une seule image, l’adaptation de domaine non supervisée a récemment été explorée afin de réduire la dépendance vis-à-vis de grands jeux de données annotés basés sur des images. Toutefois, cette approche s’accompagne du coût d’entraîner plusieurs modèles ou de nécessiter des protocoles d’entraînement complexes. Nous formulons l’adaptation de domaine non supervisée pour l’estimation de profondeur monoscopique comme un problème d’apprentissage semi-supervisé basé sur la cohérence, en supposant uniquement l’accès aux étiquettes vérité terrain du domaine source. À cette fin, nous introduisons une fonction de perte par paires qui régularise les prédictions sur le domaine source tout en imposant une cohérence des perturbations entre plusieurs versions augmentées des échantillons non étiquetés du domaine cible. L’approche proposée est particulièrement simple et efficace, nécessitant uniquement l’entraînement d’un seul modèle, contrairement aux méthodes précédentes. Dans nos expériences, nous nous appuyons sur les benchmarks standards d’estimation de profondeur KITTI et NYUv2 pour démontrer des résultats de pointe par rapport aux approches connexes. En outre, nous analysons la simplicité et l’efficacité de notre méthode à travers une série d’études d’ablation. Le code est disponible à l’adresse suivante : \url{https://github.com/AmirMaEl/SemiSupMDE}.