HyperAIHyperAI
il y a 17 jours

Pré-entraînement non supervisé pour la ré-identification de personnes

Dengpan Fu, Dongdong Chen, Jianmin Bao, Hao Yang, Lu Yuan, Lei Zhang, Houqiang Li, Dong Chen
Pré-entraînement non supervisé pour la ré-identification de personnes
Résumé

Dans cet article, nous présentons un grand jeu de données non étiqueté pour la ré-identification de personnes (Re-ID), nommé « LUPerson », et effectuons la première tentative d’entraînement non supervisé afin d’améliorer la capacité de généralisation des représentations d’features apprises pour la Re-ID. Ce travail vise à résoudre le problème selon lequel tous les jeux de données existants pour la Re-ID de personnes sont de taille limitée, en raison des coûts élevés liés à l’annotation des données. Les travaux antérieurs ont cherché à atténuer cette pénurie de données en utilisant des modèles pré-entraînés sur ImageNet, mais ces approches souffrent d’un écart de domaine important entre ImageNet et les données de Re-ID de personnes. LUPerson est un jeu de données non étiqueté comprenant 4 millions d’images provenant de plus de 200 000 identités, soit 30 fois plus volumineux que le plus grand jeu de données Re-ID existant à ce jour. Il couvre également une gamme bien plus diversifiée d’environnements d’acquisition (par exemple, paramètres de caméra, scènes, etc.). À partir de ce jeu de données, nous étudions de manière systématique les facteurs clés pour l’apprentissage de représentations Re-ID sous deux angles : l’augmentation de données et la perte contrastive. L’entraînement non supervisé réalisé sur ce grand jeu de données permet efficacement d’obtenir une représentation Re-ID générique, bénéficiant ainsi à toutes les méthodes existantes de Re-ID de personnes. En utilisant notre modèle pré-entraîné dans des cadres de base, nos approches atteignent des résultats de pointe sans nécessiter de modifications supplémentaires (« bells and whistles ») sur quatre jeux de données Re-ID largement utilisés : CUHK03, Market1501, DukeMTMC et MSMT17. Nos résultats montrent également que l’amélioration des performances est particulièrement marquée sur des jeux de données cibles de petite taille ou dans des scénarios à peu d’exemples (few-shot).