HyperAIHyperAI
il y a 16 jours

Détection généralisable de piétons : l'éléphant dans la pièce

Irtiza Hasan, Shengcai Liao, Jinpeng Li, Saad Ullah Akram, Ling Shao
Détection généralisable de piétons : l'éléphant dans la pièce
Résumé

La détection de piétons est utilisée dans de nombreuses applications basées sur la vision, allant de la surveillance vidéo à la conduite autonome. Malgré des performances élevées, il reste largement inconnu dans quelle mesure les détecteurs existants se généralisent à des données inédites. Cela revêt une importance cruciale, car un détecteur pratique doit être prêt à être utilisé dans divers scénarios applicatifs. À cet effet, nous menons dans cet article une étude approfondie en appliquant un principe général d’évaluation croisée directe entre jeux de données. À travers cette analyse, nous constatons que les détecteurs d’objets piétons les plus performants actuellement, bien qu’ils fonctionnent très bien lorsqu’ils sont entraînés et évalués sur le même jeu de données, se généralisent mal lors d’une évaluation croisée entre jeux de données. Nous démontrons que deux facteurs expliquent cette tendance. Premièrement, leurs architectures (par exemple, les paramètres des ancres) sont souvent biaisées vers les benchmarks populaires dans le cadre traditionnel d’entraînement et d’évaluation sur un seul jeu de données, ce qui limite considérablement leur capacité de généralisation. Deuxièmement, les sources d’entraînement sont généralement peu denses en piétons et manquent de diversité scénaristique. Surprenamment, nous constatons que, dans une évaluation croisée directe, un détecteur d’objets généraliste, sans adaptation spécifique aux piétons dans sa conception, se généralise bien mieux que les détecteurs d’objets piétons d’avant-garde existants. En outre, nous montrons que des jeux de données diversifiés et denses, collectés par le web crawling, constituent une source efficace pour l’entraînement préalable (pre-training) en détection de piétons. En conséquence, nous proposons une nouvelle pipeline d’entraînement progressive, qui s’avère particulièrement efficace pour la détection de piétons orientée vers la conduite autonome. Par conséquent, cette étude suggère que, dans la conception future de détecteurs de piétons généralisables, davantage d’attention devrait être accordée à l’évaluation croisée entre jeux de données. Le code et les modèles sont disponibles à l’adresse suivante : https://github.com/hasanirtiza/Pedestron.

Détection généralisable de piétons : l'éléphant dans la pièce | Articles de recherche récents | HyperAI