Command Palette
Search for a command to run...
PYSKL : Vers de Bonnes Pratiques pour la Reconnaissance d'Actions à Partir de Squelettes
PYSKL : Vers de Bonnes Pratiques pour la Reconnaissance d'Actions à Partir de Squelettes
Haodong Duan Jiaqi Wang Kai Chen Dahua Lin
Résumé
Nous présentons PYSKL : une boîte à outils open-source pour la reconnaissance d’actions basée sur les squelettes, fondée sur PyTorch. Cette boîte à outils prend en charge une large variété d’algorithmes de reconnaissance d’actions à partir de squelettes, incluant des approches basées sur les réseaux de neurones à convolution (CNN) et les réseaux de neurones à graphe (GCN). Contrairement aux projets open-source existants, qui ne proposent généralement qu’un ou deux algorithmes, PYSKL implémente six algorithmes distincts dans un cadre unifié, intégrant à la fois les meilleures pratiques les plus récentes et les approches originales, afin de faciliter la comparaison de l’efficacité et de l’efficience. Nous proposons également un modèle original de reconnaissance d’actions basé sur les GCN, nommé ST-GCN++, qui atteint des performances compétitives sans recourir à des mécanismes d’attention complexes, se positionnant ainsi comme une base solide (strong baseline). Par ailleurs, PYSKL prend en charge l’entraînement et le test sur neuf benchmarks de reconnaissance d’actions basés sur les squelettes, atteignant des performances de pointe (state-of-the-art) sur huit d’entre eux. Afin de favoriser les recherches futures dans ce domaine, nous mettons à disposition un grand nombre de modèles entraînés ainsi que des résultats détaillés sur les benchmarks, offrant ainsi des perspectives précieuses. PYSKL est disponible à l’adresse suivante : https://github.com/kennymckormick/pyskl, et est activement maintenu. Nous mettrons à jour ce rapport à chaque ajout de nouvelles fonctionnalités ou benchmarks. La version actuelle correspond à PYSKL v0.2.