HyperAIHyperAI
il y a 2 mois

Une base de référence simple mais efficace pour l’estimation de la posture humaine en 3D

Julieta Martinez; Rayat Hossain; Javier Romero; James J. Little
Une base de référence simple mais efficace pour l’estimation de la posture humaine en 3D
Résumé

Suite au succès des réseaux de neurones convolutifs profonds, les méthodes les plus avancées pour l'estimation de la posture humaine en 3D se sont concentrées sur des systèmes profonds bout-à-bout qui prédiseient les emplacements des articulations en 3D à partir de pixels d'images brutes. Malgré leurs performances excellentes, il est souvent difficile de déterminer si leur erreur résiduelle provient d'une compréhension limitée de la posture en 2D (visuelle) ou d'un échec à mapper les postures en 2D dans des positions tridimensionnelles. Avec l'objectif de comprendre ces sources d'erreur, nous avons entrepris de construire un système capable de prédire les positions en 3D à partir des emplacements des articulations en 2D. À notre grande surprise, nous avons découvert que, avec la technologie actuelle, le « lifting » (élévation) des emplacements véritables des articulations en 2D vers l'espace 3D est une tâche qui peut être résolue avec un taux d'erreur remarquablement faible : un réseau neuronal profond et relativement simple dépasse le meilleur résultat rapporté jusqu'à présent d'environ 30 % sur Human3.6M, le plus grand benchmark public disponible pour l'estimation de la posture en 3D. De plus, l'entraînement de notre système sur la sortie d'un détecteur 2D préexistant et d'avant-garde (\ie, en utilisant les images comme entrée) produit des résultats d'avant-garde -- cela inclut une gamme de systèmes qui ont été entraînés bout-à-bout spécifiquement pour cette tâche. Nos résultats suggèrent qu'une grande partie de l'erreur des systèmes modernes d'estimation de la posture humaine en 3D provient de leur analyse visuelle et indiquent des pistes pour progresser davantage dans ce domaine.注释:- “lifting” 在此上下文中指的是从2D关节位置提升到3D空间的过程,因此在法语中保留了这个术语并加注了中文解释。- “off-the-shelf” 翻译为“préexistant”,以保持简洁和正式。- “\ie” 是拉丁缩写“id est”的意思,相当于法语中的“c'est-à-dire”(即)。- 其他专业术语如“deep convolutional networks”, “Human3.6M” 和 “state-of-the-art” 均使用了通用的法语译法。

Une base de référence simple mais efficace pour l’estimation de la posture humaine en 3D | Articles de recherche récents | HyperAI