Mouvement intermédiaire robuste

Dans ce travail, nous présentons une nouvelle technique robuste de génération de transitions, fondée sur des réseaux de neurones récurrents adversariaux, qui peut servir d’outil innovant pour les animateurs 3D. Ce système synthétise des mouvements de haute qualité en utilisant des clés temporellement éparse comme contraintes d’animation. Cette approche rappelle le rôle de l’interpolation (in-betweening) dans les pipelines d’animation traditionnels, où un animateur dessine les images intermédiaires entre des clés fournies. Nous montrons d’abord qu’un modèle de prédiction de mouvement d’avant-garde ne peut pas être facilement transformé en générateur robuste de transitions en n’ajoutant que des informations de conditionnement relatives aux clés futures. Pour résoudre ce problème, nous proposons ensuite deux nouveaux modificateurs d’embeddings additifs, appliqués à chaque pas de temps aux représentations latentes encodées dans l’architecture du réseau. Le premier modificateur est un embedding « temps à l’arrivée », qui permet de moduler la durée de la transition avec un seul modèle. Le second est un vecteur de bruit cible programmé, qui rend le système robuste aux distorsions de cible et permet d’échantillonner différentes transitions à partir de clés fixes. Pour évaluer qualitativement notre méthode, nous avons développé un plugin personnalisé pour MotionBuilder, qui utilise notre modèle entraîné pour effectuer de l’interpolation dans des scénarios de production. Pour une évaluation quantitative de la performance en matière de transitions et de généralisation à des horizons temporels plus longs, nous proposons des benchmarks bien définis sur une sous-partie du dataset Human3.6M largement utilisé, ainsi que sur LaFAN1, un nouveau dataset de capture de mouvement de haute qualité, plus adapté à la génération de transitions. Nous mettons ce nouveau dataset à disposition conjointement avec ce travail, accompagné du code nécessaire pour reproduire nos résultats de base.