HyperAIHyperAI
il y a 2 mois

Apprentissage non supervisé de la profondeur et du mouvement égocentrique à partir de vidéos

Zhou, Tinghui ; Brown, Matthew ; Snavely, Noah ; Lowe, David G.
Apprentissage non supervisé de la profondeur et du mouvement égocentrique à partir de vidéos
Résumé

Nous présentons un cadre d'apprentissage non supervisé pour la tâche d'estimation de profondeur monoculaire et de mouvement caméra à partir de séquences vidéo non structurées. Nous atteignons cet objectif en formant simultanément des réseaux d'estimation de profondeur et de pose caméra, en utilisant la synthèse de vue comme signal de supervision. Les réseaux sont donc couplés par l'objectif de synthèse de vue pendant l'entraînement, mais peuvent être appliqués indépendamment lors des tests. Une évaluation empirique sur le jeu de données KITTI démontre l'efficacité de notre approche : 1) l'estimation de profondeur monoculaire performe aussi bien que les méthodes supervisées qui utilisent soit la pose vérité-terrain (ground-truth), soit la profondeur vérité-terrain pour l'entraînement, et 2) l'estimation de pose performe favorablement par rapport aux systèmes SLAM établis sous des conditions d'entrée comparables.

Apprentissage non supervisé de la profondeur et du mouvement égocentrique à partir de vidéos | Articles de recherche récents | HyperAI