HyperAIHyperAI
il y a 17 jours

PS-RCNN : Détection des instances humaines secondaires dans une foule par suppression de l'objet principal

Zheng Ge, Zequn Jie, Xin Huang, Rong Xu, Osamu Yoshie
PS-RCNN : Détection des instances humaines secondaires dans une foule par suppression de l'objet principal
Résumé

La détection des corps humains dans des scènes fortement encombrées constitue un problème difficile. Deux raisons principales expliquent cette difficulté : 1) les indices visuels faibles des instances fortement occluées ne fournissent pas suffisamment d'informations pour une détection précise ; 2) les instances fortement occluées sont plus susceptibles d’être supprimées par la suppression non maximale (NMS). Pour surmonter ces deux défis, nous proposons une variante de détecteurs à deux étapes appelée PS-RCNN. PS-RCNN détecte d’abord les objets légèrement ou non occlués via un module R-CNN (appelé P-RCNN), puis supprime les objets détectés en utilisant des masques en forme humaine, afin que les caractéristiques des objets fortement occlués puissent émerger. Ensuite, PS-RCNN utilise un autre module R-CNN spécialisé dans la détection des humains fortement occlués (appelé S-RCNN) pour identifier les objets manqués par P-RCNN. Les résultats finaux sont obtenus par fusion des sorties des deux modules R-CNN. Par ailleurs, nous introduisons un module High Resolution RoI Align (HRRA) afin de préserver au maximum les caractéristiques à haute résolution des parties visibles des humains fortement occlués. PS-RCNN améliore significativement le rappel et l’AP de respectivement 4,49 % et 2,92 % sur CrowdHuman par rapport à la méthode de référence. Des améliorations similaires sont également observées sur le jeu de données WiderPerson.