Structures picturales 3D revisitées : estimation multiple de la posture humaine
Nous abordons le problème de l’estimation de la posture 3D de plusieurs humains à partir de plusieurs vues. Le passage de l’estimation d’une seule personne à celle de plusieurs personnes, ainsi que du plan 2D au espace 3D, pose des défis importants en raison d’un espace d’état bien plus vaste, de superpositions (occlusions) et d’ambiguïtés entre les vues lorsque l’identité des individus n’est pas connue à l’avance. Pour relever ces difficultés, nous réduisons d’abord l’espace d’état en effectuant une triangulation des paires correspondantes de parties du corps détectées par des détecteurs de parties pour chaque vue caméra. Afin de résoudre les ambiguïtés dues à des associations erronées ou mélangées de parties provenant de plusieurs personnes après la triangulation, ainsi qu’aux détections fausses positives, nous introduisons un modèle de structures picturales 3D (3DPS). Ce modèle s’appuie sur des potentiels unaires issues de plusieurs vues, tout en intégrant un modèle a priori dans les fonctions de potentiel pair et ternaire. Pour équilibrer l’influence des différents potentiels, les paramètres du modèle sont appris à l’aide d’un SVM structuré (SSVM). Le modèle est générique et peut être appliqué aussi bien à l’estimation de posture d’un seul humain qu’à celle de plusieurs. Pour évaluer notre approche sur les cas d’un seul ou de plusieurs humains, nous utilisons quatre jeux de données distincts. Nous analysons d’abord l’apport de chaque type de potentiel, puis comparons nos résultats avec ceux de méthodes connexes, démontrant ainsi une performance supérieure.