Tiefenschätzung aus 4D-Lichtfeld-Videos

Die Schätzung der Tiefe (Disparität) aus 4D Lichtfeld-(LF)-Bildern ist in den letzten Jahren ein aktives Forschungsthema gewesen. Die meisten Studien haben sich auf die Schätzung der Tiefe aus statischen 4D-LF-Bildern konzentriert, ohne zeitliche Informationen – also LF-Videos – zu berücksichtigen. In dieser Arbeit wird ein end-to-end-neurales Netzwerk-Architektur für die Tiefenschätzung aus 4D-LF-Videos vorgestellt. Zudem wird ein mittelgroßes synthetisches 4D-LF-Video-Datensatz erstellt, der zur Ausbildung von Methoden auf Basis tiefer neuronalen Netze genutzt werden kann. Experimentelle Ergebnisse, die sowohl auf synthetischen als auch auf realen 4D-LF-Videos basieren, zeigen, dass zeitliche Informationen zur Verbesserung der Genauigkeit der Tiefenschätzung insbesondere in rauschbehafteten Regionen beitragen. Der Datensatz und der Quellcode sind unter folgender Adresse verfügbar: https://mediaeng-lfv.github.io/LFV_Disparity_Estimation