HyperAIHyperAI
il y a 3 mois

Optimisation basée sur le consensus pour l'estimation de la posture 3D humaine dans les coordonnées caméra

Diogo C Luvizon, Hedi Tabia, David Picard
Optimisation basée sur le consensus pour l'estimation de la posture 3D humaine dans les coordonnées caméra
Résumé

L'estimation de la posture 3D humaine est fréquemment considérée comme la tâche d'estimer les postures 3D par rapport à l'articulation racine du corps. En alternative, nous proposons une méthode d'estimation de posture 3D humaine dans les coordonnées de la caméra, permettant une combinaison efficace des données annotées 2D et des poses 3D, ainsi qu'une généralisation directe à plusieurs vues. Pour cela, nous formulons le problème comme une estimation de posture dans l'espace du frustum de vue, où la prédiction de profondeur absolue et les estimations de profondeur relative entre joints sont déconnectées. Les prédictions 3D finales sont obtenues dans les coordonnées de la caméra par projection inverse. Sur cette base, nous présentons également un algorithme d'optimisation fondé sur le consensus pour les prédictions multi-vues à partir d'images non calibrées, nécessitant une seule procédure d'entraînement monoscopique. Bien que notre méthode soit indirectement liée aux paramètres intrinsèques de la caméra utilisée pour l'entraînement, elle converge néanmoins pour des caméras aux paramètres intrinsèques différents, produisant des estimations cohérentes à un facteur d'échelle près. Notre méthode améliore l'état de l'art sur des jeux de données bien connus d'estimation de posture 3D, réduisant l'erreur de prédiction de 32 % dans le benchmark le plus courant. Nous rapportons également nos résultats en erreur de position absolue de posture, atteignant en moyenne 80 mm pour les estimations monoscopiques et 51 mm pour les estimations multi-vues.