Structures picturales 3D pour l'estimation multiple de postures humaines

Dans ce travail, nous abordons le problème de l’estimation de la pose 3D de plusieurs personnes à partir de plusieurs vues. Ce problème est plus complexe que l’estimation de la pose 3D d’une seule personne, en raison d’un espace d’état beaucoup plus vaste, de masquages partiels ainsi que d’ambiguïtés entre les vues lorsque l’identité des personnes n’est pas connue à l’avance. Pour relever ces défis, nous commençons par réduire l’espace d’état en effectuant une triangulation des articulations corporelles correspondantes, extraites à partir de détecteurs de parties corporelles sur des paires de vues caméra. Afin de résoudre les ambiguïtés liées aux parties corporelles erronées ou mélangées provenant de plusieurs personnes après triangulation, ainsi que celles résultant des détections de parties corporelles fausses positives, nous introduisons un nouveau modèle de structures picturales 3D (3DPS). Ce modèle infère les configurations 3D des corps humains à partir de notre espace d’état réduit. Le modèle 3DPS est générique et applicable aussi bien à l’estimation de la pose d’une seule personne qu’à celle de plusieurs personnes. Pour comparer notre méthode aux approches les plus avancées, nous évaluons d’abord notre méthode sur l’estimation de la pose 3D d’une seule personne, sur les jeux de données HumanEva-I [22] et KTH Multiview Football Dataset II [8]. Ensuite, nous introduisons et évaluons notre méthode sur deux nouveaux jeux de données dédiés à l’estimation de la pose 3D de plusieurs personnes.