HyperAIHyperAI
il y a 2 mois

CrowdPose : Estimation efficace des poses dans les scènes bondées et un nouveau benchmark

Jiefeng Li; Can Wang; Hao Zhu; Yihuan Mao; Hao-Shu Fang; Cewu Lu
CrowdPose : Estimation efficace des poses dans les scènes bondées et un nouveau benchmark
Résumé

L'estimation de la posture multi-personne est fondamentale pour de nombreuses tâches en vision par ordinateur et a connu des progrès significatifs ces dernières années. Cependant, peu de méthodes précédentes ont exploré le problème de l'estimation de la posture dans des scènes surpeuplées, bien que ce soit un défi inévitable dans de nombreux scénarios. De plus, les benchmarks actuels ne peuvent pas fournir une évaluation appropriée pour de tels cas. Dans cet article, nous proposons une nouvelle méthode efficace pour résoudre le problème de l'estimation de la posture dans la foule ainsi qu'un nouveau jeu de données pour évaluer les algorithmes de manière plus précise. Notre modèle repose sur deux composantes clés : l'estimation de la posture d'une seule personne à partir de candidats articulaires (SPPE) et l'association globale des articulations maximales. Grâce à la prédiction multi-pic pour chaque articulation et à l'association globale utilisant un modèle graphique, notre méthode est robuste face aux interférences inévitables dans les scènes surpeuplées et très efficace lors des inférences. La méthode proposée dépasse les méthodes d'état de l'art sur le jeu de données CrowdPose avec une amélioration de 5,2 mAP et les résultats sur le jeu de données MSCOCO démontrent la capacité généralisatrice de notre méthode. Le code source et le jeu de données seront rendus publiquement disponibles.