HyperAIHyperAI

Command Palette

Search for a command to run...

EMDM : Modèle de diffusion de mouvement efficace pour une génération rapide et de haute qualité des mouvements

Wenyang Zhou Zhiyang Dou Zeyu Cao Zhouyingcheng Liao Jingbo Wang Wenjia Wang Yuan Liu Taku Komura Wenping Wang Lingjie Liu

Résumé

Nous présentons le modèle de diffusion de mouvement efficace (EMDM) pour la génération rapide et de haute qualité de mouvements humains. Les modèles de diffusion génératifs actuels ont produit des résultats impressionnants, mais ils peinent à accélérer la génération sans compromettre la qualité. D'une part, les travaux précédents, tels que la diffusion latente de mouvement, effectuent la diffusion dans un espace latent pour gagner en efficacité, mais l'apprentissage d'un tel espace latent peut être une tâche non négligeable. D'autre part, l'accélération de la génération par une augmentation naïve de la taille des pas d'échantillonnage, comme dans le cas du DDIM (Denoising Diffusion Implicit Models), entraîne souvent une dégradation de la qualité car elle échoue à approximer la distribution débruitante complexe.Pour résoudre ces problèmes, nous proposons l'EMDM, qui capture la distribution complexe au cours de plusieurs étapes d'échantillonnage dans le modèle de diffusion, permettant ainsi un nombre beaucoup plus réduit d'étapes d'échantillonnage et une accélération significative de la génération. Cela est réalisé grâce à un GAN (Generative Adversarial Network) conditionnel pour la diffusion débruitante, capable de capturer des distributions multimodales entre des tailles d'étapes arbitraires (et potentiellement plus grandes) conditionnées par des signaux de contrôle. Cette approche permet une génération de mouvements en moins d'étapes avec une fidélité et une diversité élevées. Pour minimiser les artefacts indésirables du mouvement, des pertes géométriques sont imposées lors de l'apprentissage du réseau.En conséquence, l'EMDM atteint une génération de mouvements en temps réel et améliore considérablement l'efficacité des modèles de diffusion de mouvement par rapport aux méthodes existantes tout en assurant une génération de mouvements de haute qualité. Notre code sera rendu publiquement disponible à la publication.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp