Apprentissage de dictionnaire à contrainte de géométrie et de sparsité de groupe pour la reconnaissance d’actions à partir de cartes de profondeur.

La reconnaissance d’actions humaines basée sur les informations de profondeur fournies par des capteurs de profondeur commerciaux constitue une tâche importante mais difficile. Les cartes de profondeur bruitées, les longueurs variables des séquences d’actions et les styles libres de réalisation des actions peuvent entraîner de fortes variations intra-classes. Dans cet article, un nouveau cadre basé sur le codage parcimonieux et le matching pyramidal temporel (TPM) est proposé pour la reconnaissance d’actions humaines à partir de données de profondeur. En particulier, un algorithme d’apprentissage de dictionnaire spécifique par classe et discriminant est introduit pour le codage parcimonieux. En ajoutant des contraintes de parcimonie par groupes et des contraintes géométriques, les caractéristiques peuvent être efficacement reconstruites par le sous-dictionnaire appartenant à la même classe, tout en préservant les relations géométriques entre les caractéristiques dans les coefficients calculés. L’approche proposée est évaluée sur deux jeux de données standard capturés par des caméras de profondeur. Les résultats expérimentaux montrent que l’algorithme proposé atteint de manière répétée des performances supérieures à celles des méthodes de pointe. De plus, la méthode d’apprentissage de dictionnaire proposée surpasse également les approches classiques d’apprentissage de dictionnaire.