HyperAIHyperAI
il y a 15 jours

Une méthode non supervisée à haute précision pour la ré-identification de personnes utilisant des informations auxiliaires extraites des jeux de données

Hehan Teng, Tao He, Yuchen Guo, Guiguang Ding
Une méthode non supervisée à haute précision pour la ré-identification de personnes utilisant des informations auxiliaires extraites des jeux de données
Résumé

Les méthodes supervisées de réidentification de personnes (re-ID) reposent fortement sur des étiquettes d'apprentissage de haute qualité issues de caméras multiples, ce qui entrave considérablement leur déploiement dans des applications réelles. Bien que les méthodes non supervisées permettent de réduire les coûts d'annotation des données, leurs performances restent encore nettement inférieures à celles des approches supervisées. Dans ce travail, nous exploitons pleinement les informations auxiliaires extraites des jeux de données pour une apprentissage multimodal des caractéristiques, notamment l'information de caméra, l'information temporelle et l'information spatiale. En analysant les biais de style des caméras, les caractéristiques des trajectoires des piétons et les positions du réseau de caméras, nous proposons trois modules : la contrainte de chevauchement temporel (Time-Overlapping Constraint, TOC), la similarité spatio-temporelle (Spatio-Temporal Similarity, STS) et la pénalité pour même caméra (Same-Camera Penalty, SCP), afin d’exploiter efficacement ces informations auxiliaires. Ces dernières améliorent la performance du modèle et la précision de l’inférence en établissant des contraintes d’association ou en fusionnant avec les caractéristiques visuelles. En outre, nous introduisons trois astuces d’entraînement efficaces : la perte de croisement à lissage de labels restreint (Restricted Label Smoothing Cross Entropy Loss, RLSCE), la perte triplet adaptative par poids (Weight Adaptive Triplet Loss, WATL) et les itérations d’entraînement dynamiques (Dynamic Training Iterations, DTI). Ces techniques permettent d’atteindre des taux mAP de 72,4 % et 81,1 % sur les jeux de données MARS et DukeMTMC-VideoReID, respectivement. En combinant ces modules exploitant les informations auxiliaires, notre méthode atteint un mAP de 89,9 % sur DukeMTMC, où les modules TOC, STS et SCP contribuent tous de manière significative à l’amélioration des performances. La méthode proposée dépasse la plupart des méthodes existantes de re-ID non supervisées et réduit efficacement l’écart entre les approches non supervisées et supervisées. Le code source est disponible à l’adresse suivante : https://github.com/tenghehan/AuxUSLReID.

Une méthode non supervisée à haute précision pour la ré-identification de personnes utilisant des informations auxiliaires extraites des jeux de données | Articles de recherche récents | HyperAI