2ヶ月前

多様な確率的な人間行動ジェネレータを学習するための滑らかな潜在遷移の学習

Wang, Zhenyi ; Yu, Ping ; Zhao, Yang ; Zhang, Ruiyi ; Zhou, Yufan ; Yuan, Junsong ; Chen, Changyou
多様な確率的な人間行動ジェネレータを学習するための滑らかな潜在遷移の学習
要約

人間の動き生成は、複雑で多様な動的パターンを正確にモデル化する必要性から、長年にわたり困難な課題となっています。既存の方法の多くは、RNNなどのシーケンスモデルを用いて、元の動作空間での遷移を直接モデル化しています。しかし、高次元性と潜在的なノイズにより、このような動作遷移のモデル化は特に困難です。本論文では、骨格ベースの動作生成に焦点を当て、低次元の動作シーケンスの潜在空間上で滑らかで多様な遷移をモデル化することを提案します。潜在シーケンスに基づいて、すべての潜在的な動作ポーズが共有するフレームごとのデコーダによって動作が生成されます。具体的には、滑らかな潜在シーケンスをモデル化するために暗黙的なRNNが定義され、そのランダム性(多様性)は入力からのノイズによって制御されます。標準的な動作予測手法とは異なり、当モデルは条件付きの動作ポーズなしで純粋なノイズから動作シーケンスを生成することができます。さらに注目に値するのは、訓練中に混合クラスから未見の动作を生成することも可能です。当モデルは双方向ジェネレーティブ・アドバーザリアル・ネットワーク(GAN)フレームワークを使用して学習され、特定のクラスや混合クラスの多様な動作シーケンスを生成するだけでなく、同じモデル内で動作シーケンスの分類も学習します。実験結果は、既存手法に対して当手法が多様な動作シーろンス生成および分類において優れていることを示しています。注:「动作」在日语中通常写作「動き」,但在某些专业文献中可能会使用「动作」以保持与原文的一致性。这里根据上下文选择了「動き」,但可以根据具体文献的风格调整为「动作」。