Apprentissage d'un réseau global latent pour la prédiction d'actions basée sur les squelettes

Les actions humaines représentées par des séquences de squelette 3D sont robustes aux arrière-plans regroupés et aux variations d'éclairage. Dans cet article, nous étudions la prédiction d'actions basée sur des squelettes, dont l'objectif est de reconnaître une action à partir d'une séquence partielle de squelette contenant des informations d'action incomplètes. Nous proposons un nouveau réseau latent global fondé sur l'apprentissage adversaire pour la prédiction d'actions. Nous démontrons que le réseau proposé fournit des informations globales à long terme latentes, complémentaires aux informations locales d'action contenues dans les séquences partielles, et contribue ainsi à améliorer la prédiction d'actions. Nous montrons que la performance de prédiction peut être améliorée en combinant ces informations globales latentes avec les informations locales d'action. Nous évaluons la méthode proposée sur trois jeux de données challengers de squelettes et rapportons des performances de pointe.