WiderPerson : Un jeu de données diversifié pour la détection dense des piétons dans des environnements réels

La détection de piétons a connu des progrès significatifs grâce à la disponibilité de jeux de données de référence existants. Toutefois, un écart subsiste quant à la diversité et à la densité entre les exigences du monde réel et les benchmarks actuels en détection de piétons : 1) la plupart des jeux de données existants proviennent d’une caméra montée sur un véhicule circulant dans des scénarios routiers réguliers, entraînant généralement une diversité insuffisante ; 2) les scénarios de foule, caractérisés par une forte occlusion des piétons, restent sous-représentés, ce qui se traduit par une faible densité. Pour combler cet écart et favoriser les recherches futures en détection de piétons, nous introduisons un nouveau jeu de données large et diversifié, nommé WiderPerson, destiné à la détection dense de piétons dans des environnements naturels. Ce jeu de données inclut cinq types d’annotations dans une large variété de scénarios, dépassant désormais le cadre des scénarios routiers. Il comprend au total 13 382 images, dotées de 399 786 annotations, soit une moyenne de 29,87 annotations par image, ce qui signifie que ce jeu de données contient des piétons denses, soumis à divers types d’occlusion. Ainsi, les piétons du jeu de données proposé présentent des défis extrêmes en raison des grandes variations de scénario et d’occlusion, ce qui le rend particulièrement adapté à l’évaluation des détecteurs de piétons dans des conditions réelles. Nous proposons une version améliorée de Faster R-CNN et une version de base de RetinaNet comme références pour ce nouveau benchmark en détection de piétons. Plusieurs expériences ont été menées sur des jeux de données antérieurs, notamment Caltech-USA et CityPersons, afin d’analyser la capacité de généralisation du jeu de données proposé, et nous obtenons des performances de pointe sur ces jeux de données sans recourir à des techniques spéciales ou des ajustements supplémentaires. Enfin, nous analysons les cas d’échec courants et constatons que la capacité de classification des détecteurs de piétons doit être améliorée afin de réduire les taux d’alarmes erronées et de détections manquées. Le jeu de données proposé est disponible à l’adresse suivante : http://www.cbsr.ia.ac.cn/users/sfzhang/WiderPerson