Suivi des têtes de piétons dans une foule dense

Le suivi des humains dans des séquences vidéo bondées est un élément crucial de la compréhension visuelle des scènes. L'augmentation de la densité de foule pose des défis en termes de visibilité des individus, limitant l'évolutivité des traqueurs piétons existants à des densités de foule plus élevées. Pour cette raison, nous proposons de revitaliser le suivi des têtes avec le jeu de données Crowd of Heads Dataset (CroHD), composé de 9 séquences totales de 11 463 images contenant plus de 2 276 838 têtes et 5 230 pistes annotées dans diverses scènes. Pour l'évaluation, nous avons proposé une nouvelle métrique, IDEucl, pour mesurer l'efficacité d'un algorithme à maintenir une identité unique sur la plus longue période possible dans l'espace des coordonnées d'image, établissant ainsi une correspondance entre le mouvement de la foule piétonne et les performances d'un algorithme de suivi. De plus, nous proposons également un nouveau détecteur de têtes, HeadHunter, conçu pour détecter les petites têtes dans des scènes bondées. Nous étendons HeadHunter avec un filtre particulaire et un module de réidentification basé sur l'histogramme couleur pour le suivi des têtes. Afin d'établir une base solide, nous comparons notre traqueur aux traqueurs piétons les plus avancés actuellement disponibles sur CroHD et démontrons sa supériorité, notamment en ce qui concerne les métriques de préservation d'identité. Avec un détecteur de têtes léger et un traqueur efficace en matière de préservation d'identité, nous croyons que nos contributions seront utiles pour l'avancement du suivi piéton dans les foules denses.