2ヶ月前

MotionPCM: リアルタイム動作合成のフェーズ一貫性モデル

Jiang, Lei ; Wei, Ye ; Ni, Hao
MotionPCM: リアルタイム動作合成のフェーズ一貫性モデル
要約

拡散モデルは、その強力な生成能力により、人間の動作合成において人気のある選択肢となっています。しかし、高計算複雑性と多数のサンプリングステップがリアルタイムアプリケーションに課題をもたらしています。幸いにも、一貫性モデル(Consistency Model: CM)は、数百回から数回(通常4回未満)にサンプリングステップを大幅に削減し、拡散モデルの合成を著しく加速する解決策を提供しています。しかし、潜在空間におけるテキスト条件付きの人間の動作合成にCMを適用すると、生成結果が満足できるものになりません。本論文では、MotionPCMと呼ばれる段階的一貫性モデルベースアプローチを提案します。これは、潜在空間でのリアルタイム動作合成の品質と効率を向上させるために設計されています。HumanML3Dデータセットでの実験結果によると、当社のモデルは単一のサンプリングステップで30フレーム以上のリアルタイム推論を達成し、従来の最先端技術に対してFIDで38.9%の改善を示しています。コードは再現のために公開されます。

MotionPCM: リアルタイム動作合成のフェーズ一貫性モデル | 最新論文 | HyperAI超神経