
要約
私たちは、原始点群データを基にした新しい3D物体検出フレームワーク、IPOD(Instance Point-based Object Detection)を提案します。このフレームワークは各ポイントに対して物体提案を行うことで、基本要素としてのポイントから始まります。このパラダイムは、情報の高い再現率と高忠実度を提供し、点群データの処理に適した方法となっています。私たちはエンドツーエンドで学習可能なアーキテクチャを設計しました。これにより、提案内のすべてのポイントの特徴がバックボーンネットワークから抽出され、最終的なバウンディングボックス推論のために提案特徴が得られます。これらの特徴はコンテキスト情報と正確な点群座標を含んでおり、性能向上に寄与します。私たちはKITTIデータセット上で実験を行い、3D物体検出、鳥瞰図(Bird's Eye View: BEV)検出および2D物体検出における性能を評価しました。私たちの手法は新たな最先端の成果を達成し、特に困難なセットにおいて大きな優位性を示しています。