HyperAIHyperAI

Monokulare Tiefenschätzung

Monokulare Tiefenschätzung ist die Aufgabe, den Tiefenwert jedes Pixels relativ zur Kamera anhand eines einzelnen RGB-Bildes zu schätzen. Diese Aufgabe ist eine wichtige Voraussetzung für die Szeneinterpretation in Anwendungen wie der 3D-Szenerkonstruktion, autonomen Fahrt und erweiterten Realität. Aktuelle Hauptmethoden umfassen das Design komplexer Netze, um Tiefenkarten direkt zu regredieren, oder das Segmentieren des Eingangsbildes in mehrere Intervalle, um die Rechenkomplexität zu reduzieren. Gängige Evaluationsmetriken sind der Root Mean Square Error (RMSE) und der Absolute Relative Error.