HyperAIHyperAI
il y a 4 mois

Estimation robuste des poses humaines 3D à partir d'une seule image

Chunyu Wang; Yizhou Wang; Zhouchen Lin; Alan L. Yuille; Wen Gao
Estimation robuste des poses humaines 3D à partir d'une seule image
Résumé

L'estimation de la posture humaine est une étape clé pour la reconnaissance d'actions. Nous proposons une méthode permettant d'estimer des postures humaines en 3D à partir d'une seule image, qui fonctionne en conjonction avec un détecteur de pose/articulations existant en 2D. L'estimation de la posture en 3D est difficile car plusieurs postures en 3D peuvent correspondre à la même posture en 2D après projection, en raison du manque d'informations sur la profondeur. De plus, les estimateurs actuels de pose en 2D sont généralement peu précis, ce qui peut entraîner des erreurs dans l'estimation en 3D. Nous abordons ces défis de trois manières : (i) Nous représentons une posture en 3D comme une combinaison linéaire d'un ensemble parcimonieux de bases apprises à partir de squelettes humains en 3D. (ii) Nous imposons des contraintes sur la longueur des membres pour éliminer les squelettes anthropomorphiquement invraisemblables. (iii) Nous estimons une posture en 3D en minimisant l'erreur de norme $L_1$ entre la projection de la posture en 3D et la détection correspondante en 2D. Le terme de perte de norme $L_1$ est robuste aux estimations inexactes des articulations en 2D. Nous utilisons la méthode des directions alternées (ADM) pour résoudre efficacement le problème d'optimisation. Notre approche surpasse les méthodes les plus avancées actuellement disponibles sur trois jeux de données de référence.