Forêts de régression par balayage de profondeur pour l'estimation de la posture 3D humaine à partir d'images
Nous abordons le problème de l'estimation de la posture 3D à partir d'images monoculaires. Toutefois, au lieu d'apprendre une régression directe des caractéristiques d'image vers la posture complète, nous prédisons les positions des articulations dans l'espace 3D, puis déduisons la posture à l'aide d'un cadre basé sur une structure picturale 3D. Pour la régression, nous utilisons des forêts de régression, qui se sont révélées efficaces pour prédire la posture 2D à partir d'images ou la posture 3D à partir de données de profondeur. Toutefois, ces approches ne peuvent pas être directement appliquées, car chaque caractéristique locale d'image ou de profondeur estime les positions relatives des articulations par rapport à sa propre localisation. Bien que cette position relative soit bien définie lorsque les localisations des caractéristiques et des articulations sont données dans un plan 2D ou dans l'espace 3D, elle n'est pas définie lorsque les caractéristiques sont extraites à partir d'images 2D sans information de profondeur, et que les localisations des articulations doivent être prédites dans un système de coordonnées 3D du monde.