PRANK:RANKingを用いたモーション予測

歩行者や人間が運転する車両などのエージェントの運動予測は、自動運転分野における最も重要な課題の一つである。ドライビング全体の安全性および乗客の快適性は、この問題の成功裏の解決に直接依存する。また、運動予測は自動運転工学において依然として最も困難な課題の一つであり、その主な理由は、状況が与えられたときのエージェントの将来行動に高いばらつきが生じるためである。このばらつきの主な原因は、エージェントの意図の不確実性(たとえば、右折するか前方へ進むか)によって引き起こされる多様なモード(multimodality)と、特定の意図の実現における不確実性(たとえば、どの車線に右折するか)である。リアルタイムの自動運転パイプライン内で実用的に有用であるためには、運動予測システムは、この不確実性を効率的に記述・定量化する手段を提供しなければならない。具体的には、事後確率のモードとその確率を計算する、あるいは特定の軌道に対応する点における密度を推定するような方法が必要である。また、物理的に不可能な軌道に大きな確率密度を割り当ててはならない。なぜなら、そうした軌道は予測結果を処理するシステムを混乱させる可能性があるからである。本論文では、上記の要件を満たすPRANK手法を提案する。PRANKは、エージェント周囲のラスタライズド鳥瞰図(bird-eye view)を入力とし、畳み込みニューラルネットワーク(CNN)を用いてシーンの特徴を抽出する。その後、与えられたシーンにおいて物理的に妥当なエージェントの軌道の条件付き分布を生成する。PRANKの主な貢献は、潜在的軌道空間(latent trajectory space)における最近傍法(nearest-neighbor methods)を用いた分布表現の仕組みであり、これによりリアルタイムでの効率的な推論が可能となる。我々は、自社開発データセットおよびArgoverseデータセット上でPRANKを評価した結果、競争力ある性能を示した。