2ヶ月前

EMDM: 効率的な運動拡散モデルによる高速かつ高品質な運動生成

Zhou, Wenyang ; Dou, Zhiyang ; Cao, Zeyu ; Liao, Zhouyingcheng ; Wang, Jingbo ; Wang, Wenjia ; Liu, Yuan ; Komura, Taku ; Wang, Wenping ; Liu, Lingjie
EMDM: 効率的な運動拡散モデルによる高速かつ高品質な運動生成
要約

高速かつ高品質なヒューマンモーション生成のためのEfficient Motion Diffusion Model (EMDM) を紹介します。現在の最先端の生成拡散モデルは印象的な結果を出していますが、品質を犠牲にすることなく高速な生成を達成するには課題があります。一方、モーション潜在拡散などの以前の研究では、効率性のために潜在空間内で拡散を行いますが、そのような潜在空間を学習することは容易ではありません。他方、DDIMのように単純にサンプリングステップサイズを増やすことで生成を加速すると、複雑なデノイジング分布を近似できないため、品質が低下することがあります。これらの問題に対処するために、我々はEMDMを提案します。このモデルは、拡散モデル内の複数のサンプリングステップで複雑な分布を捉え、大幅に少ないサンプリングステップと生成の大幅な加速を可能にします。これは、制御信号に基づいて任意(そして潜在的に大きな)ステップサイズ間での多峰性データ分布を捉える条件付きデノイジング拡散GANによって実現されます。これにより、少ないステップでの高忠実度かつ多様性のあるモーションサンプリングが可能になります。望ましくないモーションアーティファクトを最小限に抑えるために、ネットワーク学習中に幾何学的損失が課されます。その結果、EMDMはリアルタイムのモーション生成を達成し、既存の方法と比較して運動拡散モデルの効率性を大幅に向上させつつ、高品質なモーション生成も実現しています。本研究のコードは公開される予定です。

EMDM: 効率的な運動拡散モデルによる高速かつ高品質な運動生成 | 最新論文 | HyperAI超神経