2ヶ月前

自律走行用の多視点3D物体検出ネットワーク

Xiaozhi Chen; Huimin Ma; Ji Wan; Bo Li; Tian Xia
自律走行用の多視点3D物体検出ネットワーク
要約

本論文は、自動運転シナリオにおける高精度の3次元物体検出を目的としています。私たちはMulti-View 3Dネットワーク(MV3D)というセンサ融合フレームワークを提案します。このフレームワークはLIDARポイントクラウドとRGB画像の両方を取り扱い、向き付き3次元バウンディングボックスを予測します。疎な3次元ポイントクラウドをコンパクトな多視点表現で符号化しています。ネットワークは2つのサブネットワークから構成されています:1つは3次元物体提案生成用、もう1つは多視点特徴量融合用です。提案ネットワークは、3次元ポイントクラウドの鳥瞰図表現から効率的に3次元候補ボックスを生成します。私たちは深層融合スキームを設計し、複数の視点からの領域特徴量を結合し、異なるパスの中間層間での相互作用を可能にしました。困難なKITTIベンチマークでの実験結果は、私たちの手法が3次元位置特定および3次元検出タスクにおいて最先进技术より約25%および30%高いAP(平均精度)を達成していることを示しています。さらに、LIDARベースの手法の中で最も難しいデータに対する2次元検出においても、私たちの手法は最先进技术よりも10.3%高いAPを得ています。

自律走行用の多視点3D物体検出ネットワーク | 最新論文 | HyperAI超神経