11日前
SVGA-Net:ポイントクラウドからの3Dオブジェクト検出を 위한スパースボクセルグラフアテンションネットワーク
Qingdong He, Zhengning Wang, Hao Zeng, Yi Zeng, Yijun Liu

要約
点群からの正確な3Dオブジェクト検出は、自動運転において重要な要素となっている。しかし、従来の手法で用いられるボリューム表現や投影手法は、局所的な点群セット間の関係を適切に捉えることができていない。本論文では、原始的なLIDARデータから比較的高い性能の3D検出を実現するための、エンドツーエンドで学習可能な新規ネットワークである「スパースボクセル・グラフアテンションネットワーク(SVGA-Net)」を提案する。SVGA-Netは主にボクセル・グラフモジュールとスパースからデーンスへの回帰モジュールから構成されている。具体的には、SVGA-Netは各3D球形ボクセル内で局所的な完全グラフを構築し、すべてのボクセルを対象としたグローバルなKNNグラフを構成する。これらの局所的およびグローバルなグラフは、特徴抽出の際のアテンション機構として機能し、より強力な特徴表現を実現する。さらに、新規に設計されたスパースからデーンスへの回帰モジュールは、異なるレベルの特徴マップを統合することで、3Dボックス推定の精度を向上させる。KITTI検出ベンチマークにおける実験結果から、3Dオブジェクト検出へのグラフ表現の拡張が有効であることが示され、提案手法のSVGA-Netが優れた検出精度を達成できることを確認した。