Prédiction du Mouvement Extrême de Plusieurs Personnes

La prédiction du mouvement humain vise à prévoir les postures futures à partir d'une séquence de squelettes 3D passés. Bien que ce problème ait récemment suscité un intérêt croissant, il a principalement été abordé pour des individus isolés. Dans cet article, nous explorons ce problème lorsqu'il concerne des humains effectuant des tâches collaboratives, en cherchant à prédire le mouvement futur de deux personnes interagissant, à partir de deux séquences de leurs squelettes passés. Nous proposons un nouveau mécanisme d'attention croisée d'interaction qui exploite les informations historiques des deux individus et apprend à prédire les dépendances croisées entre les deux séquences de poses. Comme aucun jeu de données n'est disponible pour entraîner de telles situations interactives, nous avons collecté ExPI (Extreme Pose Interaction), un nouveau jeu de données basé sur un laboratoire d'interactions entre personnes, comprenant des danseurs professionnels réalisant des actions de danse Lindy-hop. Ce jeu de données contient 115 séquences avec 30 000 trames annotées par des poses et formes corporelles 3D. Nous évaluons notre réseau d'interaction croisée sur ExPI en détail et montrons qu'il surpasse constamment les méthodes les plus avancées pour la prédiction du mouvement d'un individu, tant pour les prédictions à court terme que pour celles à long terme.