Sports Re-ID : Amélioration de l’identification par ré-identification des joueurs dans les vidéos de diffusion des sports collectifs

Ce travail se concentre sur la ré-identification des joueurs dans des vidéos diffusées de sports collectifs. Plus précisément, nous nous intéressons à l’identification du même joueur dans des images capturées depuis différents points de vue des caméras au cours d’un instant donné d’un match. Cette tâche diffère de l’application classique de la ré-identification de personnes (person re-identification) en plusieurs aspects cruciaux. Premièrement, les joueurs de la même équipe portent des tenues très similaires, ce qui rend leur distinction plus difficile. Deuxièmement, le nombre d’échantillons disponibles pour chaque identité est très faible, ce qui complique l’entraînement d’un système de ré-identification. Troisièmement, les résolutions des images sont souvent très basses et varient fortement. Combinées à des occlusions importantes et à des mouvements rapides des joueurs, ces contraintes augmentent considérablement les défis posés par la ré-identification. Dans cet article, nous proposons une procédure de collecte de données hiérarchique simple mais efficace, ainsi qu’une fonction de perte basée sur les centroïdes, qui, utilisées conjointement, améliorent la précision moyenne en moyenne (mAP) de 7 à 11,5 points et le taux de précision au rang 1 (R1) de 8,8 à 14,9 points, sans aucune modification du réseau ni des hyperparamètres utilisés. Notre procédure de collecte de données améliore la similarité entre les distributions d’apprentissage et de test, favorisant ainsi la construction d’estimations plus précises des centroïdes des représentations (ou vecteurs d’features). De manière surprenante, notre étude montre qu’en présence de données extrêmement limitées, comme c’est le cas dans notre application, une fonction de perte de centroïde simple basée sur les distances euclidiennes surpasse significativement la fonction de perte populaire de type triplet-centroïde. Nous observons des améliorations comparables pour les réseaux de convolution ainsi que pour les transformateurs visuels. Notre approche figure parmi les meilleures méthodes classées dans le classement du SoccerNet Re-Identification Challenge 2022 (split de test), avec une mAP de 86,0 et un R1 de 81,5. Sur le split secret du défi, nous atteignons une mAP de 84,9 et un R1 de 80,1. Les recherches sur la ré-identification dans le contexte des sports sont encore très limitées, et notre travail constitue l’un des premiers apports documentés dans la littérature sur ce sujet.