2ヶ月前
DESIRE: 動的シーンにおける相互作用エージェントを用いた遠い未来の予測
Namhoon Lee; Wongun Choi; Paul Vernaza; Christopher B. Choy; Philip H. S. Torr; Manmohan Chandraker

要約
私たちは、動的シーンにおける複数の相互作用するエージェントの未来予測タスクのために、Deep Stochastic IOC RNN Encoder-Decoder フレームワークである DESIRE を導入します。DESIRE は以下の点で効果的に未来の物体位置を複数のシーンで予測します:1) 未来予測の多様性(つまり、同じコンテキストでも未来は異なる可能性がある)を考慮すること、2) 可能な未来の結果を見通し、それに基づいて戦略的な予測を行うこと、3) 過去の運動履歴だけでなく、シーンコンテキストやエージェント間の相互作用も考慮して推論を行うことです。DESIRE はこれらの機能を単一のエンドツーエンド学習可能なニューラルネットワークモデルで実現しており、計算効率も高いです。まず、モデルは条件付き変分オートエンコーダーを使用して多様な仮想的な未来予測サンプルセットを取得します。その後、RNN スコアリング-回帰モジュールによってこれらのサンプルが評価され、洗練されます。サンプルは累積された未来報酬を考慮してスコアリングされるため、IOC フレームワークと同様に長期的な戦略的決定が改善されます。RNN シーンコンテキスト融合モジュールは、過去の運動履歴、セマンティックシーンコンテキスト、および複数のエージェント間の相互作用を統合的に捉えます。フィードバックメカニズムにより、ランキングと洗練プロセスが反復され、さらに予測精度が向上します。私たちのモデルは KITTI および Stanford Drone Dataset の2つの公開データセット上で評価されました。実験結果は提案したモデルが他のベースライン手法と比較して予測精度を大幅に向上させることを示しています。