HyperAIHyperAI
il y a 2 mois

Estimation de la posture humaine 3D à partir d'une seule image par régression matricielle de distance

Francesc Moreno-Noguer
Estimation de la posture humaine 3D à partir d'une seule image par régression matricielle de distance
Résumé

Ce travail aborde le problème de l'estimation de la posture humaine en 3D à partir d'une seule image. Nous suivons une pipeline standard en deux étapes : la détection initiale de la position 2D des $N$ articulations du corps, puis l'utilisation de ces observations pour inférer la posture en 3D. Pour la première étape, nous utilisons un détecteur basé sur les réseaux de neurones convolutifs (CNN) récents. Pour la deuxième étape, la plupart des approches existantes effectuent une régression 2$N$-to-3$N$ des coordonnées cartésiennes des articulations. Nous montrons que des estimations de posture plus précises peuvent être obtenues en représentant à la fois les postures humaines en 2D et en 3D par des matrices de distances $N \times N$, et en formulant le problème comme une régression de matrice de distances 2D-to-3D. Pour apprendre un tel régresseur, nous nous appuyons sur des architectures simples de Réseaux Neuronaux qui, par construction, imposent la positivité et la symétrie des matrices prédites. Cette approche a également l'avantage de gérer naturellement les observations manquantes et de permettre d'hypothéquer la position des articulations non observées. Les résultats quantitatifs sur les jeux de données Humaneva et Human3.6M démontrent des gains de performance constants par rapport à l'état de l'art. L'évaluation qualitative sur les images dans le milieu naturel du jeu de données LSP, en utilisant le régresseur appris sur Human3.6M, révèle des résultats très prometteurs en termes de généralisation.

Estimation de la posture humaine 3D à partir d'une seule image par régression matricielle de distance | Articles de recherche récents | HyperAI