マルチエージェント感知のための学習型蒸留協調グラフ

マルチエージェント感知における性能と帯域幅のトレードオフを改善するため、本研究では、学習可能で姿勢に敏感かつ適応的なエージェント間協調をモデル化する新たな「蒸留型協調グラフ(DiscoGraph)」を提案する。本研究の主な貢献は以下の2点に集約される。第一に、知識蒸留を用いた教師-生徒フレームワークを提案し、DiscoGraphを訓練する。教師モデルは全体視野(ホリスティックビュー)入力を用いた初期段階での協調を採用し、生徒モデルは単一視野入力に基づく中間段階での協調を採用する。本フレームワークでは、生徒モデルにおける協調後の特徴マップが教師モデルの対応関係と一致するように制約を課すことで、DiscoGraphを学習する。第二に、DiscoGraphにおいて行列値の辺重みを導入する。この行列の各要素は、特定の空間領域におけるエージェント間の注目度(インターエージェント注目)を反映し、各エージェントが情報を豊富な領域を適応的に強調できるようにする。推論時には、単に生徒モデルである「蒸留型協調ネットワーク(DiscoNet)」を使用するだけでよい。教師-生徒フレームワークの恩恵により、共有されたDiscoNetを搭載した複数のエージェントは、仮想的な全体視野を持つ教師モデルに近い性能を達成できる。本手法は、CARLAとSUMOを併用した共同シミュレーションにより合成した大規模マルチエージェント感知データセットV2X-Sim 1.0上で検証された。マルチエージェント3Dオブジェクト検出に関する定量的および定性的な実験結果から、DiscoNetは最先端の協調感知手法と比較して、より優れた性能-帯域幅のトレードオフを達成するだけでなく、設計の論理的明確さも向上していることが示された。本研究のコードは、https://github.com/ai4ce/DiscoNet にて公開されている。