Traitement Adaptatif des Caractéristiques pour une Reconnaissance Robuste des Activités Humaines sur un Nouveau Jeu de Données Multimodal

La reconnaissance d'activités humaines (HAR) est un élément clé de nombreuses applications émergentes telles que la mobilité intelligente, l'analyse sportive, le vieillissement en milieu assisté et l'interaction homme-robot. Avec une HAR robuste, les systèmes deviendront plus conscients des humains, conduisant à des systèmes autonomes beaucoup plus sûrs et empathiques. Bien que la détection de la posture humaine ait connu des progrès significatifs avec l'avènement des réseaux neuronaux convolutifs profonds (CNNs), les recherches de pointe se sont presque exclusivement concentrées sur une seule modalité de capteur, en particulier la vidéo. Cependant, dans les applications critiques pour la sécurité, il est impératif d'utiliser plusieurs modalités de capteurs pour une opération robuste. Pour tirer parti des avantages des techniques d'apprentissage automatique de pointe pour la HAR, il est extrêmement important de disposer de jeux de données multimodaux. Dans cet article, nous présentons un nouveau jeu de données à capteurs multimodaux qui englobe neuf activités intérieures réalisées par 16 participants et capturées par quatre types de capteurs couramment utilisés dans les applications intérieures et les véhicules autonomes. Ce jeu de données multimodal est le premier du genre à être rendu librement disponible et peut être exploité pour de nombreuses applications nécessitant une HAR, notamment l'analyse sportive, l'assistance médicale et la mobilité intelligente intérieure. Nous proposons un nouvel algorithme de prétraitement des données permettant une extraction adaptative des caractéristiques du jeu de données afin qu'il puisse être utilisé par différents algorithmes d'apprentissage automatique. À travers des évaluations expérimentales rigoureuses, cet article examine les performances des approches d'apprentissage automatique pour la reconnaissance des postures et analyse la robustesse des algorithmes. Lorsqu'on effectue une HAR avec les données RGB-D provenant de notre nouveau jeu de données, des algorithmes d'apprentissage automatique tels que les réseaux neuronaux profonds ont atteint une précision moyenne allant jusqu'à 96,8 % pour la classification de toutes les activités stationnaires et dynamiques.