HyperAIHyperAI
il y a 17 jours

Détection dans les scènes bondées : une proposition, plusieurs prédictions

Xuangeng Chu, Anlin Zheng, Xiangyu Zhang, Jian Sun
Détection dans les scènes bondées : une proposition, plusieurs prédictions
Résumé

Nous proposons un détecteur d'objets basé sur des propositions simple mais efficace, visant à détecter des instances fortement chevauchées dans des scènes surpeuplées. La clé de notre approche réside dans le fait de permettre à chaque proposition de prédire un ensemble d'objets corrélés, plutôt qu'un seul objet comme dans les cadres précédents basés sur des propositions. Grâce à de nouvelles techniques telles que la perte EMD et le NMS ensembliste, notre détecteur parvient à gérer efficacement les difficultés liées à la détection d'objets fortement superposés. Sur une base FPN-Res50, notre détecteur obtient une amélioration de 4,9 % en AP sur le dataset challengé CrowdHuman et une amélioration de 1,0 % en $\text{MR}^{-2}$ sur le dataset CityPersons, sans recourir à des ajouts complexes. De plus, sur des datasets moins surpeuplés comme COCO, notre méthode permet encore d'obtenir une amélioration modérée, ce qui indique que la méthode proposée est robuste à la densité de la scène. Le code source et les modèles pré-entraînés seront publiés à l'adresse suivante : https://github.com/megvii-model/CrowdDetection.

Détection dans les scènes bondées : une proposition, plusieurs prédictions | Articles de recherche récents | HyperAI