HyperAIHyperAI
il y a 17 jours

Réseaux multi-tâches profonds pour l'estimation de la posture des piétons occlus

Arindam Das, Sudip Das, Ganesh Sistu, Jonathan Horgan, Ujjwal Bhattacharya, Edward Jones, Martin Glavin, Ciarán Eising
Réseaux multi-tâches profonds pour l'estimation de la posture des piétons occlus
Résumé

La plupart des travaux existants sur l'estimation de la posture des piétons ne prennent pas en compte l'estimation de la posture d'un piéton partiellement occlu, car les annotations des parties occlues ne sont pas disponibles dans les jeux de données automobiles pertinents. Par exemple, CityPersons, un jeu de données bien connu pour la détection de piétons dans des scènes automobiles, ne fournit pas d'annotations de posture, tandis que MS-COCO, un jeu de données non automobile, inclut des annotations pour l'estimation de posture humaine. Dans ce travail, nous proposons un cadre multi-tâches permettant d'extraire des caractéristiques de piétons à partir de tâches de détection et de segmentation d'instances, effectuées séparément sur ces deux distributions. Par la suite, un encodeur apprend des caractéristiques spécifiques à la posture en utilisant une méthode d'adaptation de domaine au niveau des instances, non supervisée, pour les instances de piétons provenant des deux distributions. Le cadre proposé améliore les performances actuelles de l'état de l'art en estimation de posture, détection de piétons et segmentation d'instances.