単眼深度推定

単眼深度推定は、単一のRGB画像からカメラに対する各ピクセルの深度値を推定するタスクです。このタスクは、3Dシーン再構成、自動運転、拡張現実などのアプリケーションにおけるシーン理解の重要な前提条件となっています。現在の主流な手法には、深度マップを直接回帰するための複雑なネットワークの設計や、計算量を削減するために入力を複数の区間に分割する方法などが含まれます。一般的な評価指標には、ルート平均二乗誤差(RMSE)と絶対相対誤差があります。

単眼深度推定 | SOTA | HyperAI超神経