BAPose : Estimation de la posture par le bas avec des représentations en cascade disjointe

Nous proposons BAPose, une nouvelle approche ascendante (bottom-up) qui obtient des résultats de pointe pour l'estimation de la posture de plusieurs personnes. Notre cadre d'apprentissage intégral de bout en bout exploite une architecture en cascade à échelle multiple décorrélée et intègre des convolutions adaptatives pour inférer les points clés avec plus de précision dans des scènes surpeuplées présentant des occultations. Les représentations à échelle multiple, obtenues par le module en cascade décorrélée dans BAPose, profitent de l'efficacité du filtrage progressif dans l'architecture en cascade tout en maintenant des champs de vision à échelle multiple comparables aux configurations pyramidales spatiales. Nos résultats sur les jeux de données COCO et CrowdPose, connus pour leur difficulté, démontrent que BAPose est un cadre efficace et robuste pour l'estimation de la posture de plusieurs personnes, réalisant des améliorations significatives en termes de précision par rapport aux méthodes actuelles les plus performantes.