単眼深度推定
単眼深度推定は、単一のRGB画像からカメラに対する各ピクセルの深度値を推定するタスクです。このタスクは、3Dシーン再構成、自動運転、拡張現実などのアプリケーションにおけるシーン理解の重要な前提条件となっています。現在の主流な手法には、深度マップを直接回帰するための複雑なネットワークの設計や、計算量を削減するために入力を複数の区間に分割する方法などが含まれます。一般的な評価指標には、ルート平均二乗誤差(RMSE)と絶対相対誤差があります。
NYU-Depth V2
HybridDepth
KITTI Eigen split
SPIDepth
KITTI Eigen split unsupervised
SPIDepth(MS+1024x320)
ETH3D
Distill Any Depth
NYU-Depth V2 self-supervised
IndoorDepth
Make3D
GCNDepth
Mid-Air Dataset
DDAD
AFNet
IBims-1
Miangoleh et al. (SGR)
SCARED-C
AF-SfMLearner
Cityscapes
SwinMTL
SUN-RGBD
VA (Virtual Apartment)
DistDepth
KITTI
MonoViT
Middlebury 2014
Miangoleh et al. (MiDaS)
Cityscapes 3D
TaskPrompter
DIML Outdoor
DIODE Indoor
DIODE Outdoor
ScaleDepth-NK
Hypersim
KITTI Object Tracking Evaluation 2012
PackNet-SfM
Matterport3D
UASOL
Virtual KITTI 2