Command Palette
Search for a command to run...
Apprentissage de la grammaire de posture pour encoder la configuration du corps humain en vue de l'estimation de posture 3D
Apprentissage de la grammaire de posture pour encoder la configuration du corps humain en vue de l'estimation de posture 3D
Fang Haoshu Xu Yuanlu Wang Wenguan Liu Xiaobai Zhu Song-Chun
Résumé
Dans cet article, nous proposons une grammaire de posture afin de résoudre le problème de l’estimation de la posture 3D humaine. Notre modèle prend directement une posture 2D en entrée et apprend une fonction de correspondance généralisée entre les espaces 2D et 3D. Le modèle proposé se compose d’un réseau de base, qui capte efficacement des caractéristiques alignées sur la posture, et d’une hiérarchie de réseaux de neurones récurrents bidirectionnels (BRNN) placés en surcouche, permettant d’intégrer explicitement un ensemble de connaissances relatives à la configuration du corps humain (à savoir, la cinématique, la symétrie, la coordination motrice). Ce modèle impose ainsi des contraintes de haut niveau sur les postures humaines. En apprentissage, nous avons développé un simulateur d’échantillons de posture permettant d’enrichir les échantillons d’entraînement dans des vues virtuelles de caméra, ce qui améliore davantage la généralisation de notre modèle. Nous validons notre méthode sur des benchmarks publics d’estimation de posture 3D humaine, et proposons un nouveau protocole d’évaluation fonctionnant dans un cadre à vue croisée, afin de vérifier la capacité de généralisation des différentes méthodes. Nous observons empiriquement que la plupart des méthodes de pointe rencontrent des difficultés dans ce cadre, tandis que notre méthode se montre particulièrement efficace face à ces défis.