
要約
未知の環境における歩行者および車両の軌道予測問題に取り組む。本問題は、シーン構造の多様性および将来の軌道が多モーダルな分布を示すため、極めて困難である。従来のアプローチは、観測された状況から複数の将来軌道への1対多マッピングを直接学習していたが、本研究では、最大エントロピー逆強化学習(MaxEnt IRL)を用いて学習されたグリッドベースの方策からサンプリングされた計画を条件として、軌道予測を行う新たなアプローチを提案する。さらに、MaxEnt IRLを再定式化し、シーン上に定義された粗い2次元グリッド上で、妥当なエージェントの目標とその目標への経路を同時に推論できる方策を実現した。また、MaxEnt方策からサンプリングされた状態系列を条件として、連続値の将来軌道を生成するアテンションベースの軌道生成器を提案する。公開されているStanford DroneおよびNuScenesデータセットを用いた定量的・定性的評価の結果、本モデルは、長期予測期間にわたり、多モーダルな予測分布を適切に表現しつつ、シーン構造に整合した高精度な軌道を生成できることを示した。