11日前

人間の運動拡散モデル

Guy Tevet, Sigal Raab, Brian Gordon, Yonatan Shafir, Daniel Cohen-Or, Amit H. Bermano
人間の運動拡散モデル
要約

自然で表現力豊かな人間の運動生成は、コンピュータアニメーション分野における「聖杯」といわれる課題である。これは、運動の可能性が多様であること、人間の知覚がその変化に極めて敏感であること、さらに正確に表現することが困難であるという点から、極めて困難なタスクである。その結果、現在の生成モデルは品質が低かったり、表現力に制限があったりする。一方で、他の分野においても顕著な生成能力を示した拡散モデル(diffusion models)は、人間の運動生成においても有望な候補とされている。その理由は、多対多の性質を持つ点にあり、しかし、リソースを大量に消費し、制御が難しいという課題も抱えている。本論文では、人間の運動領域に適切にカスタマイズされた、分類器フリー拡散に基づく生成モデルである「Motion Diffusion Model(MDM)」を提案する。MDMはTransformerベースであり、運動生成に関する既存の知見を統合している。特に注目すべき設計は、各拡散ステップにおいてノイズの予測ではなく、サンプル自体を予測する点である。このアプローチにより、運動の位置や速度に適用可能な既存の幾何学的損失(例:足接触損失)を効果的に活用できる。実証により、MDMは汎用的なアプローチであり、さまざまな条件付けモードや生成タスクに対応可能であることが示された。また、軽量なリソースで学習が可能でありながら、テキストから運動生成(text-to-motion)およびアクションから運動生成(action-to-motion)の主要ベンチマークにおいて、最先端の性能を達成している。https://guytevet.github.io/mdm-page/

人間の運動拡散モデル | 最新論文 | HyperAI超神経