2ヶ月前

HP-GAN: GANを用いた確率的な3次元人間運動予測

Emad Barsoum; John Kender; Zicheng Liu
HP-GAN: GANを用いた確率的な3次元人間運動予測
要約

人間の動作動態を予測および理解することは、モーション合成、拡張現実、セキュリティ、自動運転車両など多くの応用分野を持っています。近年、生成対抗ネットワーク(GAN)の成功により、深層ニューラルネットワークのアーキテクチャや学習アルゴリズムを使用した確率的な推定と合成データの生成に対する関心が高まっています。本研究では、改良版の改善されたワッサーシタイン生成対抗ネットワーク(WGAN-GP)を用いて訓練された新しいシーケンス・ツー・シーケンスモデルを提案します。このモデルでは、人間の動作予測に特化したカスタム損失関数を使用しています。我々がHP-GANと呼ぶこのモデルは、過去の姿勢に基づいた未来の人間の姿勢の確率密度関数を学習します。同じ入力シーケンスから異なるランダム分布に従うベクトルzを引き出して、複数の可能な未来の人間の姿勢シーケンスを予測します。さらに、非決定的な予測の品質を定量的に評価するために、与えられた骨格シーケンスが実際の人間の動作である確率を学習するモーション品質評価モデルも同時に訓練します。我々は最大級の骨格データセット2つ(NTURGB-DとHuman3.6M)でアルゴリズムをテストしました。単一および複数アクションタイプに対してモデルを訓練しました。その長期的な動作推定能力は、たった10フレームの入力から30フレーム以上の複数の妥当な未来を生成することによって示されています。同じ入力から生成される大部分のシーケンスが50%以上の確率で実際の人間のシーケンスと判断されることも示しています。本論文で使用したすべてのコードはGitHubに公開されます。

HP-GAN: GANを用いた確率的な3次元人間運動予測 | 最新論文 | HyperAI超神経