Command Palette
Search for a command to run...
Unüberwachtes Lernen von Tiefen und Eigenbewegung aus Videosequenzen
Unüberwachtes Lernen von Tiefen und Eigenbewegung aus Videosequenzen
Zhou Tinghui Brown Matthew Snavely Noah Lowe David G.
Zusammenfassung
Wir präsentieren einen unsupervisierten Lernansatz für die Schätzung von Tiefen und Kamerabewegungen aus unstrukturierten Videosequenzen mit einer einzigen Kamera. Dies erreichen wir durch die gleichzeitige Trainierung von Netzwerken zur Tiefenschätzung und Kamerapose-Schätzung, wobei die Aufgabe der Ansichtssynthese als überwachender Signal dient. Während des Trainings sind die Netzwerke somit über das Ziel der Ansichtssynthese gekoppelt, können jedoch zur Testzeit unabhängig voneinander eingesetzt werden. Die empirische Evaluation am KITTI-Datensatz zeigt die Wirksamkeit unseres Ansatzes: 1) Die monokulare Tiefenschätzung erreicht eine Leistung, die mit überwachten Methoden vergleichbar ist, die entweder wahre Pose oder wahre Tiefenwerte zur Ausbildung nutzen, und 2) die Schätzung der Kamerapose erzielt Ergebnisse, die gegenüber etablierten SLAM-Systemen unter vergleichbaren Eingabedaten vorteilhaft sind.