il y a 16 jours

DLow : Diversifiant les flux latents pour une prédiction diversifiée du mouvement humain

Ye Yuan, Kris Kitani

Résumé

Les modèles génératifs profonds sont fréquemment utilisés pour la prédiction du mouvement humain, car ils sont capables de modéliser des distributions de données multimodales et de capturer une grande diversité de comportements humains. Bien que de nombreuses recherches aient été consacrées à la conception et à l’apprentissage de tels modèles génératifs profonds, la question de la génération efficace d’échantillons diversifiés à partir d’un modèle pré-entraîné reste un problème peu exploré. Pour extraire des échantillons à partir d’un modèle génératif pré-entraîné, la plupart des méthodes existantes en prédiction du mouvement humain s’appuient sur un échantillonnage aléatoire indépendant de codes latents gaussiens, puis convertissent ces codes en échantillons de mouvement. Cette stratégie d’échantillonnage aléatoire ne garantit pas en effet une diversité des échantillons pour deux raisons principales : (1) l’échantillonnage indépendant ne force pas les échantillons à être diversifiés ; (2) l’échantillonnage repose uniquement sur la vraisemblance, ce qui peut conduire à des échantillons correspondant uniquement aux modes principaux de la distribution des données. Pour surmonter ces limitations, nous proposons une nouvelle méthode d’échantillonnage, Diversifying Latent Flows (DLow), permettant de générer un ensemble diversifié d’échantillons à partir d’un modèle génératif profond pré-entraîné. Contrairement à l’échantillonnage aléatoire indépendant, la méthode DLow échantillonne une seule variable aléatoire, puis la transforme à l’aide d’un ensemble de fonctions d’application apprenables afin d’obtenir un ensemble de codes latents corrélés. Ces codes latents corrélés sont ensuite décodés pour produire un ensemble d’échantillons corrélés. Lors de l’entraînement, DLow intègre une priorité favorisant la diversité des échantillons comme objectif pour optimiser les mappings latents et améliorer ainsi la diversité des sorties. La conception de cette priorité est particulièrement flexible et peut être adaptée pour générer des mouvements diversifiés partageant des caractéristiques communes (par exemple, des mouvements des jambes similaires mais des mouvements du haut du corps très variés). Nos expérimentations montrent que DLow surpasser les méthodes de référence les plus avancées en termes de diversité et de précision des échantillons. Le code source est disponible sur la page du projet : https://www.ye-yuan.com/dlow.