16日前

M4Depth:未確認環境における自動運転車両向け単眼深度推定

Michaël Fonder, Damien Ernst, Marc Van Droogenbroeck
M4Depth:未確認環境における自動運転車両向け単眼深度推定
要約

深度センサーが利用できない状況において、物体までの距離を推定することは自動運転車にとって極めて重要である。この場合、距離は搭載されたRGBカメラから推定しなければならないが、特に自然な屋外環境のような複雑なシーンでは、このタスクは極めて困難である。本論文では、深度推定のための新しい手法であるM4Depthを提案する。まず、連続する2フレーム間の視覚的視差と深度との間の全単射関係を確立し、この関係を活用して運動不変なピクセル単位の深度推定を実現する方法を示す。次に、ピラミッド型畳み込みニューラルネットワークアーキテクチャに基づくM4Depthの詳細を説明する。このアーキテクチャでは、各レベルが2つのカスタマイズされたコストボリュームを用いて、入力となる視差マップの推定値を段階的に精緻化する。これらのコストボリュームにより、運動に起因する視覚的空間時間的制約を活用し、多様なシーンに対して高いロバスト性を持つネットワークを実現している。我々は、多様な屋外シーンで記録された合成カメラ軌道を含む公開データセットを用いて、テストおよび一般化性能の両面で本手法のベンチマーク評価を行った。その結果、提案手法はこれらのデータセットにおいて既存の最先端手法を上回る性能を達成するとともに、標準的な深度推定ベンチマークでも良好な結果を示した。本手法のコードは、https://github.com/michael-fonder/M4Depth にて公開されている。

M4Depth:未確認環境における自動運転車両向け単眼深度推定 | 最新論文 | HyperAI超神経