Tiefenschätzung
Die Tiefenschätzung ist eine Aufgabe im Bereich der Computer Vision, die darauf abzielt, den Abstand jedes Pixels relativ zur Kamera zu messen. Diese Aufgabe extrahiert Tiefeninformationen aus mono- oder stereoskopischen Bildern. Traditionelle Methoden basieren auf der mehrbildigen Geometrie, während neuere Ansätze die Tiefenschätzung direkt durch Minimierung des Regressionsfehlers oder das Lernen, neue Ansichten aus Bildfolgen zu generieren, durchführen. Die Tiefenschätzung hat erhebliche Anwendungswerte in Bereichen wie autonomem Fahren, Roboter-Navigation und augmentierter Realität. Gängige Evaluationsmetriken umfassen den Root Mean Square Error (RMS), und wichtige Benchmark-Datensätze sind KITTI und NYUv2.
Stanford2D3D Panoramic
NYU-Depth V2
EVP
DCM
eBDtheque
Bhattacharjee et al.
ScanNetV2
Distill Any Depth
Cityscapes test
SwinMTL
DIODE
AIP-Brown
KITTI 2015
Mars DTM Estimation
GLPDepth
ScanNet
Atlas (plain)
4D Light Field Dataset
LFattNet
KITTI Eigen split
LightDepth
Matterport3D
UniFuse
Taskonomy
X-TC (Cross-Task Consistency)