Estimation de la posture multi-personnes avec des associations locales entre les articulations et les personnes

Malgré les récents succès des réseaux neuronaux pour l'estimation de la posture humaine, les approches actuelles sont limitées à l'estimation de la posture d'une seule personne et ne peuvent pas gérer des groupes ou des foules d'individus. Dans ce travail, nous proposons une méthode qui estime les postures de plusieurs personnes dans une image, où une personne peut être occultée par une autre personne ou être tronquée. À cette fin, nous considérons l'estimation de la posture multi-personne comme un problème d'association jointure-personne. Nous construisons un graphe entièrement connecté à partir d'un ensemble de candidats de jointures détectés dans une image et résolvons l'association jointure-personne ainsi que la détection des valeurs aberrantes en utilisant la programmation linéaire en nombres entiers. Étant donné que la résolution de l'association jointure-personne simultanément pour toutes les personnes dans une image est un problème NP-difficile et que même ses approximations sont coûteuses, nous résolvons le problème localement pour chaque personne. Sur le jeu de données MPII Human Pose pour plusieurs personnes, notre approche atteint la précision d'une méthode de pointe, mais elle est 6 000 à 19 000 fois plus rapide.