Réflexion sur les stratégies d'échantillonnage pour la réidentification non supervisée de personnes

L’identification de personnes non supervisée (re-ID) demeure une tâche difficile. Alors que de nombreuses recherches se sont concentrées sur la conception des architectures et les fonctions de perte, ce papier met en évidence que la stratégie d’échantillonnage joue un rôle tout aussi crucial. Nous analysons les raisons des différences de performance observées entre différentes stratégies d’échantillonnage, sous un cadre et une fonction de perte identiques. Nous proposons que le surajustement dégradé constitue un facteur important entraînant de mauvaises performances, et que l’amélioration de la stabilité statistique permet de corriger ce problème. Inspirés par cette observation, nous proposons une approche simple mais efficace, nommée group sampling, qui regroupe les échantillons provenant de la même classe. Le modèle est alors entraîné à partir d’échantillons groupés normalisés, ce qui atténue l’impact négatif des échantillons individuels. Cette méthode réorganise le pipeline de génération des pseudo-étiquettes en garantissant une classification plus efficace des échantillons dans leurs classes correctes. Elle régule progressivement le processus d’apprentissage des représentations, renforçant ainsi la stabilité statistique des représentations features. Des expériences étendues sur les jeux de données Market-1501, DukeMTMC-reID et MSMT17 montrent que le group sampling atteint des performances comparables aux méthodes de pointe, tout en surpassant les techniques actuelles dans des conditions strictement indépendantes des caméras. Le code source est disponible à l’adresse suivante : https://github.com/ucas-vg/GroupSampling.