HyperAIHyperAI
il y a 4 mois

Estimation de la posture humaine pour des scénarios réels avec foules

Thomas Golda; Tobias Kalb; Arne Schumann; Jürgen Beyerer
Estimation de la posture humaine pour des scénarios réels avec foules
Résumé

L'estimation de la posture humaine a récemment connu des progrès significatifs grâce à l'adoption des réseaux neuronaux convolutifs profonds. Ses nombreuses applications ont suscité un intérêt considérable ces dernières années. Cependant, de nombreuses applications pratiques nécessitent une estimation de la posture pour des foules humaines, ce qui reste un problème peu abordé. Dans cette étude, nous explorons des méthodes pour optimiser l'estimation de la posture dans les foules humaines, en nous concentrant sur les défis posés par les foules denses, tels que les occultations, les personnes se trouvant à proximité les unes des autres et la visibilité partielle des individus.Pour relever ces défis, nous évaluons trois aspects d'une approche de détection de la posture : i) une méthode d'augmentation de données pour introduire une robustesse aux occultations, ii) la détection explicite des parties du corps occultées, et iii) l'utilisation de jeux de données générés synthétiquement. La première approche pour améliorer la précision dans les scénarios avec foules est de générer des occultations lors de l'entraînement en utilisant des découpes de personnes et d'objets provenant du jeu de données COCO (Common Objects in Context). De plus, le jeu de données synthétiquement généré JTA (Joint Track Auto) est évalué pour son utilisation dans les applications réelles impliquant des foules.Afin de surmonter le fossé de transfert du JTA dû à une faible variété de postures et à des foules moins denses, un jeu de données complémentaire est créé pour faciliter son utilisation dans les applications réelles. En outre, les indicateurs d'occultation fournis avec le JTA sont utilisés pour entraîner un modèle qui distingue explicitement entre les parties du corps occultées et celles visibles dans deux branches distinctes. La combinaison des ajouts proposés au modèle basique aide à améliorer la précision globale de 4,7 % AP (Average Precision), offrant ainsi des résultats comparables aux approches actuelles state-of-the-art sur le jeu de données concerné.