HyperAIHyperAI
il y a 12 jours

Reconnaissance d'actions basée sur le squelette avec réseau de convolution graphique à décalage

{ Hanqing Lu, Jian Cheng, Weihan Chen, Xiangyu He, Yifan Zhang, Ke Cheng}
Reconnaissance d'actions basée sur le squelette avec réseau de convolution graphique à décalage
Résumé

La reconnaissance d’actions à partir de données squelettiques suscite un intérêt croissant en vision par ordinateur. Récemment, les réseaux de convolution de graphe (GCN), qui modélisent les squelettes humains sous forme de graphes spatio-temporels, ont obtenu des performances remarquables. Toutefois, la complexité computationnelle des méthodes basées sur les GCN reste élevée, atteignant typiquement plus de 15 GFLOPs par échantillon d’action, et certaines approches récentes dépassent même 100 GFLOPs. Un autre inconvénient réside dans la rigidité des champs réceptifs des graphes spatiaux et temporels. Bien que certaines méthodes améliorent l’expressivité du graphe spatial en introduisant des modules adaptatifs incrémentaux, leurs performances restent limitées par les structures régulières des GCN. Dans cet article, nous proposons un nouveau réseau de convolution de graphe à décalage (Shift-GCN) afin de surmonter ces deux limitations. Contrairement aux convolutions de graphe régulières lourdes, notre Shift-GCN repose sur des opérations de graphe à décalage novatrices et des convolutions ponctuelles légères, où les opérations à décalage permettent des champs réceptifs flexibles à la fois pour le graphe spatial et le graphe temporel. Sur trois jeux de données pour la reconnaissance d’actions basée sur les squelettes, le Shift-GCN proposé dépasse significativement les méthodes de pointe tout en réduisant la complexité computationnelle de plus de dix fois.

Reconnaissance d'actions basée sur le squelette avec réseau de convolution graphique à décalage | Articles de recherche récents | HyperAI