Monokulare Tiefenschätzung
Monokulare Tiefenschätzung ist die Aufgabe, den Tiefenwert jedes Pixels relativ zur Kamera anhand eines einzelnen RGB-Bildes zu schätzen. Diese Aufgabe ist eine wichtige Voraussetzung für die Szeneinterpretation in Anwendungen wie der 3D-Szenerkonstruktion, autonomen Fahrt und erweiterten Realität. Aktuelle Hauptmethoden umfassen das Design komplexer Netze, um Tiefenkarten direkt zu regredieren, oder das Segmentieren des Eingangsbildes in mehrere Intervalle, um die Rechenkomplexität zu reduzieren. Gängige Evaluationsmetriken sind der Root Mean Square Error (RMSE) und der Absolute Relative Error.
NYU-Depth V2
HybridDepth
KITTI Eigen split
SPIDepth
KITTI Eigen split unsupervised
SPIDepth(MS+1024x320)
ETH3D
Distill Any Depth
NYU-Depth V2 self-supervised
IndoorDepth
Make3D
GCNDepth
Mid-Air Dataset
DDAD
AFNet
IBims-1
Miangoleh et al. (SGR)
SCARED-C
AF-SfMLearner
Cityscapes
SwinMTL
SUN-RGBD
VA (Virtual Apartment)
DistDepth
KITTI
MonoViT
Middlebury 2014
Miangoleh et al. (MiDaS)
Cityscapes 3D
TaskPrompter
DIML Outdoor
DIODE Indoor
DIODE Outdoor
ScaleDepth-NK
Hypersim
KITTI Object Tracking Evaluation 2012
PackNet-SfM
Matterport3D
UASOL
Virtual KITTI 2