
要約
本論文は、新しいシナリオや視点における未観測カメラでの人物の将来軌道を予測する問題に取り組む。我々は、モデルが3Dシミュレーションデータのみで訓練され、実際の多数のカメラに対して即座に適用可能な「実データ不要(real-data-free)」の設定を採用する。この設定下で、シミュレーション訓練データを拡張する新たなアプローチを提案し、そのことで得られる特徴表現が未観測の実世界テストデータへより良好に一般化することを実現する。本手法の鍵となるアイデアは、最も困難なカメラ視点の特徴と、元の視点の敵対的特徴を混合することにある。本手法を「SimAug」と呼ぶ。実験の結果、SimAugは実世界の3つのベンチマークにおいて、実データを一切使用せずに有望な結果を達成し、また、スタンフォードドローンデータセットおよびVIRAT/ActEVデータセットでは、ドメイン内訓練データを用いた場合に最先端の性能を示した。