Where2comm:空間的信頼度マップを用いた通信効率的な協調認識

マルチエージェント協調的認識は、エージェント間の通信を通じて補完的な情報を共有することにより、認識性能を著しく向上させる可能性を有しています。しかしながら、これにより認識性能と通信帯域幅の間で避けがたい根本的なトレードオフが生じます。このボトルネック問題に対処するため、本研究では認識情報の空間的非均一性を反映する「空間的信頼度マップ(spatial confidence map)」を提案します。このマップにより、エージェントは空間的に疎であるが認識上重要な情報をのみ共有でき、通信すべき領域を効果的に判断することが可能になります。この新規な空間的信頼度マップを基盤として、通信効率の高い協調的認識フレームワーク「Where2comm」を提案します。Where2commの主な利点は以下の2点です:i) 実用的な圧縮を考慮し、認識上重要な領域に焦点を当てることで、少ない通信量で高い認識性能を達成可能であること;ii) 動的に通信に参加する空間領域を調整することで、変動する通信帯域幅に対応できることです。Where2commの有効性を検証するため、OPV2V、V2X-Sim、DAIR-V2X、および我々が独自に構築したCoPerception-UAVsの4つのデータセットを用い、実世界およびシミュレーション環境における3次元物体検出(カメラ/LiDARの2つのモダリティ、車両/ドローンの2種類のエージェント)を対象に評価を行いました。その結果、Where2commは従来手法を一貫して上回り、たとえばOPV2Vデータセットにおいて、DiscoNetやV2X-ViTと比較して通信量を100,000倍以上削減しつつも、依然として優れた性能を発揮しました。本研究のコードは、https://github.com/MediaBrain-SJTU/where2comm にて公開されています。