PoseTrack : Estimation et suivi conjoints de la posture de plusieurs personnes

Dans cette étude, nous abordons le problème complexe de l'estimation et du suivi conjoints de la posture de plusieurs personnes d'un nombre inconnu dans des vidéos non contraintes. Les méthodes existantes pour l'estimation de la posture de plusieurs personnes dans les images ne peuvent pas être directement appliquées à ce problème, car elles doivent également résoudre le problème d'association temporelle des individus en plus de l'estimation de la posture pour chaque personne. Nous proposons donc une nouvelle méthode qui modélise conjointement l'estimation de la posture et le suivi de plusieurs personnes dans une seule formulation. À cet effet, nous représentons les détections des articulations corporelles dans une vidéo par un graphe spatio-temporel et résolvons un programme linéaire entier pour partitionner ce graphe en sous-graphes correspondant à des trajectoires plausibles de postures corporelles pour chaque personne. L'approche proposée gère implicitement l'occlusion et la troncature des individus. Étant donné que ce problème n'a pas encore été traité quantitativement dans la littérature, nous introduisons un jeu de données difficile appelé "Multi-Person PoseTrack" et proposons également un protocole d'évaluation complètement non contraint qui ne fait aucune hypothèse sur l'échelle, la taille, l'emplacement ou le nombre de personnes. Enfin, nous évaluons l'approche proposée ainsi que plusieurs méthodes de référence sur notre nouveau jeu de données.