Command Palette
Search for a command to run...
LocalBins : Amélioration de l'estimation de profondeur par apprentissage des distributions locales
LocalBins : Amélioration de l'estimation de profondeur par apprentissage des distributions locales
Shariq Farooq Bhat Ibraheem Alhashim Peter Wonka
Résumé
Nous proposons une nouvelle architecture pour l'estimation de profondeur à partir d'une seule image. Cette architecture s'appuie sur l'architecture populaire dite « encodeur-décodeur », fréquemment utilisée comme point de départ pour toutes les tâches de régression dense. Nous nous inspirons d'AdaBins, qui estime une distribution globale des valeurs de profondeur pour l'image d'entrée, tout en évoluant l'architecture en deux directions. Premièrement, au lieu de prédire des distributions de profondeur globales, nous prédisons des distributions de profondeur pour des voisinages locaux à chaque pixel. Deuxièmement, au lieu de limiter la prédiction des distributions de profondeur uniquement à la fin du décodeur, nous intégrons toutes les couches du décodeur. Nous appelons cette nouvelle architecture LocalBins. Nos résultats démontrent une amélioration significative par rapport à l'état de l'art sur tous les critères sur le jeu de données NYU-Depth V2. Le code source ainsi que les modèles pré-entraînés seront rendus accessibles au public.