2ヶ月前
3次元提案生成と物体検出のための視点集約による統合処理
Jason Ku; Melissa Mozifian; Jungwook Lee; Ali Harakeh; Steven Waslander

要約
自動運転シナリオ向けのAVOD(Aggregate View Object Detection)ネットワークを紹介します。提案するニューラルネットワークアーキテクチャは、LIDARポイントクラウドとRGB画像を使用して、2つのサブネットワーク(領域提案ネットワーク(RPN)と二次検出ネットワーク)で共有される特徴量を生成します。提案するRPNは、高解像度の特徴マップ上で多モーダル特徴融合を行う新しいアーキテクチャを採用しており、道路シーンにおける複数の物体クラスに対して信頼性のある3D物体提案を生成できます。これらの提案を利用して、二次検出ネットワークは正確な向き付き3Dバウンディングボックス回帰とカテゴリ分類を行い、3次元空間内の物体の範囲、向き、および分類を予測します。我々が提案するアーキテクチャは、KITTI 3D物体検出ベンチマークにおいて最先端の結果を示し、リアルタイムで動作し低メモリ消費量であるため、自動運転車両への展開に適した候補となっています。コードは以下のURLから入手可能です:https://github.com/kujason/avod