HyperAIHyperAI

Command Palette

Search for a command to run...

Construction de bases plus solides et plus rapides pour la reconnaissance d'actions basée sur les squelettes

Yi-Fan Song Zhang Zhang Caifeng Shan Liang Wang

Résumé

Un problème fondamental dans la reconnaissance d’actions basée sur les squelettes réside dans la manière d’extraire des caractéristiques discriminantes à travers tous les joints du squelette. Toutefois, la complexité des modèles les plus récents de l’état de l’art (SOTA) pour cette tâche tend à être excessivement sophistiquée et sur-paramétrée. Cette faible efficacité en apprentissage et en inférence augmente considérablement les coûts de validation des architectures de modèles sur des jeux de données à grande échelle. Pour résoudre ce problème, des couches de convolution séparable avancées sont intégrées dans un réseau initial à branches multiples (MIB) fusionnées, permettant ainsi de construire une base efficace de réseau de convolution de graphe (GCN) pour la reconnaissance d’actions basée sur les squelettes. Par ailleurs, à partir de cette base, nous proposons une stratégie d’agrandissement combinée permettant d’élargir simultanément la largeur et la profondeur du modèle, aboutissant finalement à une famille de bases GCN efficaces offrant à la fois une haute précision et un nombre réduit de paramètres entraînables, désignées EfficientGCN-Bx, où « x » représente le coefficient d’agrandissement. Sur deux grands jeux de données, à savoir NTU RGB+D 60 et 120, la base EfficientGCN-B4 proposée dépasse les autres méthodes SOTA : elle atteint une précision de 91,7 % sur le benchmark cross-subject du jeu de données NTU 60, tout en étant 3,15 fois plus petite et 3,21 fois plus rapide que MS-G3D, l’une des meilleures méthodes SOTA. Le code source en version PyTorch ainsi que les modèles pré-entraînés sont disponibles à l’adresse suivante : https://github.com/yfsong0709/EfficientGCNv1.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp