HyperAIHyperAI
il y a 13 jours

Réidentification de personnes dans les vidéos : des techniques remarquables et où les trouver

Priyank Pathak, Amir Erfan Eshratifar, Michael Gormish
Réidentification de personnes dans les vidéos : des techniques remarquables et où les trouver
Résumé

La capacité à identifier la même personne à partir de plusieurs vues de caméra sans recourir explicitement à la reconnaissance faciale suscite un intérêt croissant tant dans le milieu académique que commercial. Les solutions actuelles reposent principalement sur des modèles neuronaux à attention. Dans cet article, nous proposons une nouvelle fonction de perte, appelée Attention et CL loss, qui combine une perte centrée (center loss) et une perte d’exploitation en ligne de mini-batch (Online Soft Mining, OSM), ajoutées à la perte d’attention au sein d’un réseau neuronal basé sur une attention temporelle. L’application de cette fonction de perte, conjuguée à une stratégie de « bag of tricks » pour l’entraînement, permet de dépasser l’état de l’art sur les jeux de données standard pour la ré-identification de personnes (Re-ID), à savoir MARS et PRID 2011. Le code source est disponible publiquement sur GitHub.