Retour à MLP : Une Base de Ligne Simple pour la Prédiction du Mouvement Humain

Ce travail aborde le problème de la prédiction du mouvement humain, qui consiste à prévoir les postures futures du corps à partir de séquences historiquement observées. Les approches de pointe fournissent des résultats satisfaisants, mais elles s'appuient sur des architectures d'apprentissage profond d'une complexité arbitraire, telles que les Réseaux Neuronaux Récurents (RNN), les Transformers ou les Réseaux de Convolution Graphique (GCN), nécessitant généralement plusieurs phases d'entraînement et plus de 2 millions de paramètres. Dans cet article, nous montrons qu'en combinant une série de pratiques standards, comme l'application de la Transformée en Cosinus Discrète (DCT), la prédiction du déplacement résiduel des articulations et l'optimisation de la vitesse en tant que perte auxiliaire, un réseau léger basé sur des Perceptrons Multi-Couches (MLPs) avec seulement 0,14 million de paramètres peut surpasser les performances actuelles. Une évaluation exhaustive sur les jeux de données Human3.6M, AMASS et 3DPW montre que notre méthode, nommée siMLPe, dépasse constamment toutes les autres approches. Nous espérons que notre méthode simple puisse servir de base solide pour la communauté et permettre une réflexion renouvelée sur le problème de la prédiction du mouvement humain. Le code est disponible au public à l'adresse \url{https://github.com/dulucas/siMLPe}.