
要約
単眼深度予測は、3Dシーンの幾何学的理解において重要な役割を果たしています。最近の手法では、画素単位の相対誤差などの評価指標において著しい進歩が見られますが、多くの手法が3D空間における幾何学的制約を無視しています。本研究では、深度予測に対する高次の3D幾何学的制約の重要性を示します。再構築された3D空間内でランダムにサンプリングされた3点によって決定される仮想的な法線方向という、一種類の単純な幾何学的制約を強制する損失項を設計することで、深度予測の精度を大幅に向上させることができます。特に、この予測深度が十分に正確であることで、新たにサブモデルを訓練することなく、深度から直接点群や表面法線などの良好な3D構造を復元することが可能になりました。NYU Depth-V2とKITTIという2つのベンチマークでの実験結果は、当手法の有効性と最先端の性能を示しています。