Apprentissage Contrastif Hybride avec Ensemble de Clusters pour la Ré-identification Non Supervisée de Personnes

L'identification non supervisée de personnes (ReID) vise à faire correspondre une image de requête d'un piéton aux images d'un ensemble de galerie sans étiquettes de supervision. Les approches les plus populaires pour aborder l'identification non supervisée de personnes consistent généralement à appliquer un algorithme de clustering pour générer des étiquettes pseudo au début, puis à exploiter ces étiquettes pseudo pour entraîner un réseau neuronal profond. Cependant, les étiquettes pseudo sont bruyantes et sensibles aux hyperparamètres de l'algorithme de clustering. Dans cet article, nous proposons une approche d'apprentissage contrastif hybride (HCL) pour l'identification non supervisée de personnes, qui repose sur une combinaison entre les fonctions de perte contrastive au niveau des instances et au niveau des clusters. De plus, nous présentons une approche d'apprentissage contrastif hybride basée sur un ensemble de clustering multi-granulaire (MGCE-HCL), qui adopte une stratégie d'ensemble de clustering multi-granulaire pour extraire des informations prioritaires parmi les paires d'échantillons positifs pseudo et définit une fonction de perte contrastive hybride pondérée par la priorité afin de mieux tolérer les bruits dans les échantillons positifs pseudo. Nous menons des expériences exhaustives sur deux ensembles de données de référence, Market-1501 et DukeMTMC-reID. Les résultats expérimentaux valident l'efficacité de nos propositions.