Tiefenschätzung
Die Tiefenschätzung ist eine Aufgabe im Bereich der Computer Vision, die darauf abzielt, den Abstand jedes Pixels relativ zur Kamera zu messen. Diese Aufgabe extrahiert Tiefeninformationen aus mono- oder stereoskopischen Bildern. Traditionelle Methoden basieren auf der mehrbildigen Geometrie, während neuere Ansätze die Tiefenschätzung direkt durch Minimierung des Regressionsfehlers oder das Lernen, neue Ansichten aus Bildfolgen zu generieren, durchführen. Die Tiefenschätzung hat erhebliche Anwendungswerte in Bereichen wie autonomem Fahren, Roboter-Navigation und augmentierter Realität. Gängige Evaluationsmetriken umfassen den Root Mean Square Error (RMS), und wichtige Benchmark-Datensätze sind KITTI und NYUv2.
Stanford2D3D Panoramic
NYU-Depth V2
EVP
DCM
ScanNetV2
Distill Any Depth
eBDtheque
Bhattacharjee et al.
Cityscapes test
SwinMTL
ScanNet
Atlas (plain)
KITTI 2015
DIODE
AIP-Brown
Mars DTM Estimation
GLPDepth
Matterport3D
UniFuse
4D Light Field Dataset
LFattNet
KITTI Eigen split
LightDepth
Taskonomy
X-TC (Cross-Task Consistency)