16日前

確率的かつ幾何学的深度:透視図法における物体検出

Tai Wang, Xinge Zhu, Jiangmiao Pang, Dahua Lin
確率的かつ幾何学的深度:透視図法における物体検出
要約

3Dオブジェクト検出は、ドライバー支援システムをはじめとするさまざまな実用的応用において重要な機能である。画像ベースのアプローチの中でも、モノクロカメラを用いた3D検出は、LiDARに依存する従来の手法に比べて経済的な利点を持つ代表的な一般的な設定であるが、依然として満足のいく結果を出せていない。本論文では、この問題に対する体系的な研究を初めて行う。我々は、現在のモノクロカメラ3D検出が、インスタンスの深度推定問題に簡略化できることに着目した。すなわち、不正確なインスタンス深度が、他のすべての3D属性推定の精度向上を妨げており、全体の検出性能の向上を阻害している。さらに、最近の手法は、個々のインスタンスやピクセルごとに独立して深度を推定するが、異なるオブジェクト間の幾何学的関係を無視している。これを解決するために、予測されたオブジェクト間の幾何学的関係をグラフとして構築し、そのグラフを用いて深度推定を支援する。この不適切な設定では、各インスタンスの初期深度推定は通常不正確であるため、不確実性を捉えるための確率的表現を導入する。これにより、信頼できる予測を識別し、深度の伝搬をさらに効果的に誘導できる重要な指標が得られる。基本的なアイデアは単純であるが、本手法PGD(Probabilistic Graph-based Depth estimation)はKITTIおよびnuScenesベンチマークにおいて顕著な性能向上を達成し、モノクロカメラのみを用いる視覚ベース手法の中で最も高い順位(1位)を獲得しつつ、リアルタイム処理の効率性も維持している。コードとモデルは、https://github.com/open-mmlab/mmdetection3d にて公開される予定である。

確率的かつ幾何学的深度:透視図法における物体検出 | 最新論文 | HyperAI超神経