HyperAIHyperAI
il y a 2 mois

DeeperCut : Un modèle de détection de pose multi-personnes plus profond, plus puissant et plus rapide

Eldar Insafutdinov; Leonid Pishchulin; Bjoern Andres; Mykhaylo Andriluka; Bernt Schiele
DeeperCut : Un modèle de détection de pose multi-personnes plus profond, plus puissant et plus rapide
Résumé

L'objectif de cet article est d'améliorer l'état de l'art de l'estimation de la posture articulée dans des scènes impliquant plusieurs personnes. À cette fin, nous contribuons sur trois fronts. Nous proposons (1) des détecteurs améliorés de parties du corps qui génèrent des propositions bottom-up efficaces pour les parties du corps ; (2) des termes binaires conditionnés par l'image novateurs permettant d'assembler ces propositions en un nombre variable de configurations cohérentes de parties du corps ; et (3) une stratégie d'optimisation incrémentielle qui explore l'espace de recherche plus efficacement, conduisant ainsi à une meilleure performance et à des facteurs d'accélération significatifs. L'évaluation est réalisée sur deux benchmarks d'estimation de la posture pour une seule personne et deux benchmarks d'estimation de la posture pour plusieurs personnes. L'approche proposée dépasse considérablement les meilleurs résultats connus en estimation de la posture pour plusieurs personnes tout en démontrant une performance compétitive sur la tâche d'estimation de la posture pour une seule personne. Les modèles et le code sont disponibles à l'adresse http://pose.mpi-inf.mpg.de