Contraste de cluster pour la réidentification de personnes non supervisée

Les méthodes d’identification de personnes (re-ID) non supervisées de pointe entraînent les réseaux neuronaux à l’aide d’une perte softmax non paramétrique basée sur une mémoire. Les vecteurs de caractéristiques d’instances stockés dans la mémoire sont étiquetés par pseudo-étiquettes via un regroupement (clustering) et mis à jour au niveau de chaque instance. Toutefois, les tailles de clusters variables entraînent une incohérence dans le processus de mise à jour de chaque cluster. Pour résoudre ce problème, nous proposons Cluster Contrast, une méthode qui stocke les vecteurs de caractéristiques et calcule la perte de contraste au niveau du cluster. Notre approche utilise une représentation unique par cluster pour décrire chaque groupe, permettant ainsi de construire un dictionnaire mémoire au niveau du cluster. Cette stratégie permet de maintenir efficacement la cohérence du regroupement tout au long du pipeline et de réduire de manière significative la consommation de mémoire GPU. Par conséquent, notre méthode résout le problème d’incohérence des clusters et est adaptée à des jeux de données plus volumineux. En outre, nous utilisons différentes algorithmes de clustering afin de démontrer la robustesse et la généralisation de notre cadre. L’application de Cluster Contrast à un pipeline standard d’identification non supervisée conduit à des améliorations considérables de 9,9 %, 8,3 % et 12,1 % en mAP par rapport aux méthodes d’état de l’art purement non supervisées, ainsi que de 5,5 %, 4,8 % et 4,4 % en mAP par rapport aux méthodes d’état de l’art d’adaptation de domaine non supervisée sur les jeux de données Market, Duke et MSMT17. Le code source est disponible à l’adresse suivante : https://github.com/alibaba/cluster-contrast.