Comptage de foule itératif

Dans cette étude, nous abordons le problème du décompte de foules dans les images. Nous présentons une approche d'estimation de densité basée sur un réseau neuronal convolutif (CNN) pour résoudre ce problème. La prédiction directe d'une carte de densité à haute résolution est une tâche complexe. Par conséquent, nous proposons une architecture CNN à deux branches pour générer des cartes de densité à haute résolution, où la première branche produit une carte de densité à faible résolution, et la deuxième branche intègre la prédiction à faible résolution et les cartes de caractéristiques issues de la première branche pour générer une carte de densité à haute résolution. Nous suggérons également une extension multistage de notre méthode, où chaque étape du processus utilise les prédictions de toutes les étapes précédentes. Une comparaison empirique avec les méthodes précédentes d'avant-garde en matière de décompte de foules montre que notre méthode atteint l'erreur absolue moyenne la plus basse sur trois benchmarks difficiles de décompte de foules : Shanghaitech, WorldExpo'10 et UCF datasets.