
要約
自律走行パイプラインにおいて、認識モジュールは周囲の道路状況に対する視覚的理解を提供する。認識タスクの中でも、他の交通参加者(エージェント)の位置を特定する車両検出は、安全な運転にとって極めて重要である。本研究では、3D LiDAR点群にのみ依存して動作する、グラフ畳み込みネットワーク(GCN)に基づくグラフベースの3D物体検出パイプライン「PointRGCN」を提案する。より高精度な3D物体検出を実現するため、提案特徴量および文脈情報を集約するグラフ表現を活用している。本研究では、2段階型3D物体検出パイプラインにリジューダルGCNを統合し、新たなグラフ表現を用いて3D物体の候補を精緻化している。特に、R-GCNはリジューダルGCNであり、3D候補を分類および回帰する機能を有し、C-GCNは複数の候補間で文脈情報を共有することで、さらに候補を精緻化する文脈GCNである。これらの精緻化モジュールを統合した新規な3D検出パイプライン、PointRGCNを構築し、鳥瞰図検出タスクにおける「易しい」難易度において、最先端の性能を達成した。