
オブジェクト検出はスマート交通システムの中心的な課題であり、近年の単一車両LiDARを用いた3次元検出技術の進展により、知能型エージェントが意思決定および経路計画を行うための高精度な位置情報を提供可能であることが示されている。単一車両の周辺認識と比較して、複数視点の車両-インフラ協調認識は、盲点の除去や認識範囲の拡大といった根本的な利点を有しており、現在の研究の注目領域となっている。しかし、現行の協調認識手法は、単一視点の輪郭情報が欠如することに起因する根本的な問題を無視しがちであり、融合の複雑性の向上に重点を置いている。本研究では、特に車両形状の予測能力を強化することを目的として、車両-すべて(V2X)協調認識(V2X-AHD)というマルチビュー車両-インフラ協調認識システムを提案する。まず、異なる訓練データを用いた非対称な異種蒸留ネットワークを導入し、複数視点の教師特徴から単一視点の学生特徴へと特徴を転送することで、輪郭認識の精度を向上させる。点群データの疎らさという課題に対し、スパース畳み込みに基づくプラグイン型特徴抽出バックボーン「Spara Pillar」を提案し、パラメータ数を削減するとともに、特徴抽出能力を向上・強化する。さらに、マルチヘッド自己注意機構(MSA)を用いて単一視点特徴を融合し、軽量設計により滑らかな特徴表現を実現する。大規模オープンデータセットV2Xsetへの適用結果から、本手法が最先端の性能を達成することが確認された。本研究によれば、V2X-AHDは3次元オブジェクト検出の精度を効果的に向上させるとともに、ネットワークのパラメータ数を削減でき、協調認識の基準となるベンチマークとしての価値を持つ。本論文の実装コードは、https://github.com/feeling0414-lab/V2X-AHD にて公開されている。