HyperAIHyperAI

Command Palette

Search for a command to run...

MotionPCM: リアルタイム動作合成のフェーズ一貫性モデル

Lei Jiang Ye Wei Hao Ni

概要

拡散モデルは、その強力な生成能力により、人間の動作合成において人気のある選択肢となっています。しかし、高計算複雑性と多数のサンプリングステップがリアルタイムアプリケーションに課題をもたらしています。幸いにも、一貫性モデル(Consistency Model: CM)は、数百回から数回(通常4回未満)にサンプリングステップを大幅に削減し、拡散モデルの合成を著しく加速する解決策を提供しています。しかし、潜在空間におけるテキスト条件付きの人間の動作合成にCMを適用すると、生成結果が満足できるものになりません。本論文では、MotionPCMと呼ばれる段階的一貫性モデルベースアプローチを提案します。これは、潜在空間でのリアルタイム動作合成の品質と効率を向上させるために設計されています。HumanML3Dデータセットでの実験結果によると、当社のモデルは単一のサンプリングステップで30フレーム以上のリアルタイム推論を達成し、従来の最先端技術に対してFIDで38.9%の改善を示しています。コードは再現のために公開されます。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
MotionPCM: リアルタイム動作合成のフェーズ一貫性モデル | 記事 | HyperAI超神経