
要約
近年のマルチエージェント問題、たとえば人間の運動予測や群衆の中でのロボットナビゲーションにおいて、社会的意識を持つ運動表現の学習が中心的な役割を果たしている。多くの進展が見られる一方で、ニューラルネットワークによって学習された既存の表現は、クローズドループ予測(例えば、衝突する軌道の出力)において一般化が困難な状況に直面している。この問題の主な原因は、順次予測における非i.i.d.(独立同分布でない)性と、不均一に分布した訓練データの存在にある。直感的に言えば、訓練データが安全な空間における人間の行動(すなわち「正例」)のみから構成されている場合、学習アルゴリズムが衝突のような「負例」の概念を捉えることは極めて困難である。本研究では、自己教師学習を用いて負例を明示的にモデル化することにより、この課題に取り組む。具体的には、(i) 実際の正例と合成された負例を区別することで、抽出された運動表現を正則化する「社会的対照損失(social contrastive loss)」を導入し、(ii) 稀だが危険な状況に関する事前知識に基づき、意味のある負例サンプルを構築する。本手法は、最近の軌道予測、行動クラーニング、強化学習アルゴリズムにおける衝突率を顕著に低減し、複数のベンチマークにおいて最先端の手法を上回る性能を示した。コードは以下のURLで公開されている:https://github.com/vita-epfl/social-nce。