2ヶ月前
GS3D: 自動運転向け効率的な3D物体検出フレームワーク
Buyu Li; Wanli Ouyang; Lu Sheng; Xingyu Zeng; Xiaogang Wang

要約
自動運転のシナリオにおいて、単一のRGB画像に基づく効率的な3D物体検出フレームワークを提案します。本研究では、2D画像から潜在的な3D情報を抽出し、点群データやステレオデータを使用せずに物体の正確な3Dバウンディングボックスを決定することに重点を置いています。市販の2D物体検出器を活用し、各予測された2Dボックスに対して効率的に粗いキューボイドを取得する巧妙な手法を提案します。この粗いキューボイドは十分な精度を持ち、物体の3Dボックスを精緻化することで決定するためのガイドとなります。従来の最先端手法が2Dバウンディングボックスから抽出した特徴量のみを使用してボックスの精緻化を行うのに対し、我々は可視表面の視覚的特徴量を用いて物体の3D構造情報を探索します。表面からの新しい特徴量は、2Dバウンディングボックスのみを使用することによる表現の曖昧さ問題を解消するために利用されます。さらに、3Dボックスの精緻化に関する異なる手法を探求し、品質認識損失(quality aware loss)を持つ分類フォーマレーションが回帰よりも遥かに優れた性能を持つことを発見しました。KITTIベンチマークでの評価において、我々の手法は単一RGB画像に基づく3D物体検出における現行の最先端手法を上回っています。