3ヶ月前

自律走行アプリケーション向け階層的自己教師付き単眼絶対深度推定へ

Feng Xue, Guirong Zhuo, Ziyuan Huang, Wufei Fu, Zhuoyue Wu, Marcelo H. Ang Jr
自律走行アプリケーション向け階層的自己教師付き単眼絶対深度推定へ
要約

近年、単眼深度推定に対する自己教師付き手法は、特に自動運転応用を想定した深度推定タスクにおいて急速に重要な分野へと発展している。現行の手法は高い全体精度を達成しているものの、依然として(a)オブジェクトレベルでの深度推定の不正確さ、および(b)スケール因子の不確実性という課題を抱えている。前者はテクスチャの重複や正確なオブジェクト境界の推定不備を引き起こし、後者はLiDARなどの追加センサによる深度の真値情報、またはステレオカメラを追加の学習入力として用いる必要性を生じさせ、実装の難易度を高めている。本研究では、これらの2つの課題を統合的に解決するため、DNetを提案する。本研究の貢献は以下の2点に集約される:(a) オブジェクトレベルでの深度推定を改善するため、新しい密結合予測(Dense Connected Prediction, DCP)層を提案した。(b) 自動運転シーンに特化して、密な幾何制約(Dense Geometrical Constraints, DGC)を導入し、自動車に追加コストをかけずに正確なスケール因子を回復可能とした。広範な実験により、DCP層およびDGCモジュールがそれぞれ前述の課題に対して有効であることが実証された。DCP層の導入により、深度マップにおけるオブジェクト境界の識別が明確になり、オブジェクトレベルでの深度推定がより連続的かつ正確なものとなった。また、カメラの高さが既知であり、地面ピクセルが画像全体の1.03%以上を占める条件下では、DGCを用いたスケール回復性能が真値情報を利用した場合と同等であることが示された。コードは以下のURLで公開されている:https://github.com/TJ-IPLab/DNet。