HyperAIHyperAI

Command Palette

Search for a command to run...

DLow : Diversifiant les flux latents pour une prédiction diversifiée du mouvement humain

Ye Yuan Kris Kitani

Résumé

Les modèles génératifs profonds sont fréquemment utilisés pour la prédiction du mouvement humain, car ils sont capables de modéliser des distributions de données multimodales et de capturer une grande diversité de comportements humains. Bien que de nombreuses recherches aient été consacrées à la conception et à l’apprentissage de tels modèles génératifs profonds, la question de la génération efficace d’échantillons diversifiés à partir d’un modèle pré-entraîné reste un problème peu exploré. Pour extraire des échantillons à partir d’un modèle génératif pré-entraîné, la plupart des méthodes existantes en prédiction du mouvement humain s’appuient sur un échantillonnage aléatoire indépendant de codes latents gaussiens, puis convertissent ces codes en échantillons de mouvement. Cette stratégie d’échantillonnage aléatoire ne garantit pas en effet une diversité des échantillons pour deux raisons principales : (1) l’échantillonnage indépendant ne force pas les échantillons à être diversifiés ; (2) l’échantillonnage repose uniquement sur la vraisemblance, ce qui peut conduire à des échantillons correspondant uniquement aux modes principaux de la distribution des données. Pour surmonter ces limitations, nous proposons une nouvelle méthode d’échantillonnage, Diversifying Latent Flows (DLow), permettant de générer un ensemble diversifié d’échantillons à partir d’un modèle génératif profond pré-entraîné. Contrairement à l’échantillonnage aléatoire indépendant, la méthode DLow échantillonne une seule variable aléatoire, puis la transforme à l’aide d’un ensemble de fonctions d’application apprenables afin d’obtenir un ensemble de codes latents corrélés. Ces codes latents corrélés sont ensuite décodés pour produire un ensemble d’échantillons corrélés. Lors de l’entraînement, DLow intègre une priorité favorisant la diversité des échantillons comme objectif pour optimiser les mappings latents et améliorer ainsi la diversité des sorties. La conception de cette priorité est particulièrement flexible et peut être adaptée pour générer des mouvements diversifiés partageant des caractéristiques communes (par exemple, des mouvements des jambes similaires mais des mouvements du haut du corps très variés). Nos expérimentations montrent que DLow surpasser les méthodes de référence les plus avancées en termes de diversité et de précision des échantillons. Le code source est disponible sur la page du projet : https://www.ye-yuan.com/dlow.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
DLow : Diversifiant les flux latents pour une prédiction diversifiée du mouvement humain | Articles | HyperAI