Estimation de la posture 3D égocentrique d'un humain dans l'espace global

L'estimation de la posture 3D égocentrique d'un être humain à l'aide d'une seule caméra fisheye est devenue récemment très populaire, car elle permet de capturer une large gamme d'activités quotidiennes dans des environnements non contraints, ce qui est difficile pour les systèmes traditionnels de capture de mouvement « extérieur-interne » utilisant des caméras externes. Cependant, les méthodes existantes présentent plusieurs limitations. Un problème majeur est que les postures estimées se situent dans le système de coordonnées local de la caméra fisheye, plutôt que dans le système de coordonnées mondial, ce qui est restrictif pour de nombreuses applications. De plus, ces méthodes souffrent d'une précision limitée et d'une instabilité temporelle dues aux ambiguïtés causées par le montage monoculaire et l'occlusion sévère dans une perspective égocentrique fortement distordue. Pour surmonter ces limitations, nous proposons une nouvelle méthode d'estimation de la posture corporelle 3D globale égocentrique utilisant une seule caméra fisheye montée sur la tête. Pour obtenir des postures globales précises et temporellement stables, une optimisation spatio-temporelle est effectuée sur une séquence d'images en minimisant les erreurs de reprojection des cartes thermiques et en imposant des a priori locaux et globaux du mouvement corporel appris à partir d'un ensemble de données mocap (motion capture). Les résultats expérimentaux montrent que notre approche surpasses les méthodes de pointe actuelles tant quantitativement que qualitativement.