HyperAIHyperAI
il y a 2 mois

Réseau de convolution graphique basé sur les parties pour la reconnaissance d'actions

Kalpit Thakkar; P J Narayanan
Réseau de convolution graphique basé sur les parties pour la reconnaissance d'actions
Résumé

Les actions humaines sont composées de mouvements articulés des parties du corps ou de « gestes ». Le squelette humain est intuitivement représenté sous forme de graphe épars, avec les articulations comme nœuds et les connexions naturelles entre elles comme arêtes. Les réseaux de neurones à convolution sur graphe ont été utilisés pour reconnaître des actions à partir de vidéos squelettiques. Nous introduisons un réseau de neurones à convolution sur graphe basé sur les parties (PB-GCN) pour cette tâche, inspiré par les modèles déformables basés sur les parties (DPMs). Nous divisons le graphe squelettique en quatre sous-graphes avec des articulations partagées entre eux et apprenons un modèle de reconnaissance en utilisant un réseau de neurones à convolution sur graphe basé sur les parties. Nous montrons que ce modèle améliore la performance de la reconnaissance par rapport à un modèle utilisant l'ensemble du graphe squelettique. Au lieu d'utiliser les coordonnées 3D des articulations comme caractéristiques des nœuds, nous démontrons que l'utilisation de coordonnées relatives et de déplacements temporels augmente la performance. Notre modèle atteint une performance d'état de l'art sur deux jeux de données基准数据集 NTURGB+D 和 HDM05,在骨骼动作识别方面表现出色。(Note: The last sentence contains Chinese characters which should be replaced with their French equivalents.)Notre modèle atteint une performance d'état de l'art sur deux jeux de données de référence difficiles, NTURGB+D et HDM05, pour la reconnaissance d'actions squelettiques.