Command Palette
Search for a command to run...
Pose est tout ce dont vous avez besoin : le système de reconnaissance d'activité par groupe uniquement basé sur la pose (POGARS)
Pose est tout ce dont vous avez besoin : le système de reconnaissance d'activité par groupe uniquement basé sur la pose (POGARS)
Haritha Thilakarathne Aiden Nibali Zhen He Stuart Morgan
Résumé
Nous introduisons une nouvelle approche fondée sur l’apprentissage profond pour la reconnaissance d’activités de groupe, appelée Pose Only Group Activity Recognition System (POGARS), conçue pour prédire l’activité de groupe réalisée à partir uniquement des poses suivies des individus. Contrairement aux approches existantes en reconnaissance d’activités de groupe, POGARS utilise des réseaux de neurones convolutifs à une dimension (1D CNN) afin d’apprendre les dynamiques spatio-temporelles des individus participant à une activité de groupe, tout en renonçant à l’extraction de caractéristiques à partir des données de pixels. Le modèle proposé intègre un mécanisme d’attention spatiale et temporelle pour estimer l’importance individuelle de chaque personne, ainsi qu’un apprentissage multi-tâches permettant de réaliser simultanément la classification des activités de groupe et celle des actions individuelles. Les résultats expérimentaux confirment que POGARS obtient des performances très compétitives par rapport aux méthodes de pointe sur un jeu de données public largement utilisé dédié au volley-ball, malgré l’utilisation exclusive de poses suivies comme entrée. De plus, nos expériences montrent qu’en ne s’appuyant que sur les poses comme entrée, POGARS présente une meilleure capacité de généralisation par rapport aux méthodes utilisant des données RGB.