HyperAIHyperAI
il y a 2 mois

Estimation 3D profonde de la pose humaine monoculaire par relèvement dimensionnel en cascade

Zhang, Changgong ; Zhan, Fangneng ; Chang, Yuan
Estimation 3D profonde de la pose humaine monoculaire par relèvement dimensionnel en cascade
Résumé

L'estimation de la posture 3D à partir d'une seule image est un problème complexe en raison de l'ambiguïté de la profondeur. Parmi les méthodes précédentes, certaines relèvent les articulations 2D, obtenues grâce à des détecteurs externes de posture 2D, dans l'espace 3D. Cependant, ces approches ignorent les informations contextuelles des images, qui sont des indices forts pour l'estimation de la posture 3D. D'autres méthodes prédisez directement les articulations à partir d'images monoculaires mais utilisent une représentation de sortie 2.5D (P^{2.5D} = (u,v,z^{r})) où (u) et (v) sont dans l'espace d'image tandis que (z^{r}) est dans l'espace 3D relatif à la racine. Par conséquent, les informations véritables (par exemple, la profondeur de l'articulation racine par rapport à la caméra) sont généralement utilisées pour transformer la sortie 2.5D dans l'espace 3D, ce qui limite leur applicabilité en pratique.Dans cette étude, nous proposons un nouveau cadre d'apprentissage bout-à-bout qui non seulement exploite les informations contextuelles mais produit également directement la sortie dans l'espace 3D grâce à une élévation dimensionnelle en cascade. Plus précisément, nous décomposons la tâche d'élévation de la posture de l'espace d'image 2D à l'espace spatial 3D en plusieurs sous-tâches séquentielles : 1) estimation des squelettes cinématiques et des articulations individuelles dans l'espace 2D, 2) estimation de la profondeur relative à la racine, et 3) élévation vers l'espace 3D. Chacune de ces sous-tâches utilise des supervisions directes et des caractéristiques contextuelles d'image pour guider le processus d'apprentissage.Des expériences approfondies montrent que le cadre proposé atteint des performances de pointe sur deux jeux de données largement utilisés pour l'estimation de la posture humaine en 3D (Human3.6M et MuPoTS-3D).

Estimation 3D profonde de la pose humaine monoculaire par relèvement dimensionnel en cascade | Articles de recherche récents | HyperAI