11日前

単眼3Dオブジェクト検出のためのカテゴリカルディープネス分布ネットワーク

Cody Reading, Ali Harakeh, Julia Chae, Steven L. Waslander
単眼3Dオブジェクト検出のためのカテゴリカルディープネス分布ネットワーク
要約

単眼3次元物体検出は、従来のマルチセンサーシステムと比較して構成が単純であるため、自動運転車両において重要な課題である。単眼3次元検出の主な課題は、直接的な距離測定が不可能なため、物体およびシーンの手がかりから正確に物体の深度を推定することにある。多くの手法が深度を直接推定することで3次元検出を支援しようとしているが、深度推定の不正確さにより、性能が限定的であることが問題となっている。本研究で提案するカテゴリカル深度分布ネットワーク(CaDDN)は、各ピクセルに対して予測されたカテゴリカル深度分布を用いて、豊かな文脈特徴情報を3次元空間における適切な深度区間へ投影する。その後、計算効率の高い鳥瞰図(bird's-eye-view)投影と単段階検出器を用いて、最終的なバウンディングボックスを生成する。CaDDNは、深度推定と物体検出を統合的に最適化する完全微分可能なエンドツーエンドアプローチとして設計されている。本手法はKITTI 3次元物体検出ベンチマークにおいて、発表済みの単眼手法の中で1位を達成した。また、新たに公開されたWaymo Open Datasetにおいて、初めての単眼3次元検出結果を提供している。CaDDNのコードリリースも実施しており、公開されている。

単眼3Dオブジェクト検出のためのカテゴリカルディープネス分布ネットワーク | 最新論文 | HyperAI超神経