Command Palette
Search for a command to run...
Pré-entraînement non supervisé pour la ré-identification de personnes
Pré-entraînement non supervisé pour la ré-identification de personnes
Dengpan Fu Dongdong Chen Jianmin Bao Hao Yang Lu Yuan Lei Zhang Houqiang Li Dong Chen
Résumé
Dans cet article, nous présentons un grand jeu de données non étiqueté pour la ré-identification de personnes (Re-ID), nommé « LUPerson », et effectuons la première tentative d’entraînement non supervisé afin d’améliorer la capacité de généralisation des représentations d’features apprises pour la Re-ID. Ce travail vise à résoudre le problème selon lequel tous les jeux de données existants pour la Re-ID de personnes sont de taille limitée, en raison des coûts élevés liés à l’annotation des données. Les travaux antérieurs ont cherché à atténuer cette pénurie de données en utilisant des modèles pré-entraînés sur ImageNet, mais ces approches souffrent d’un écart de domaine important entre ImageNet et les données de Re-ID de personnes. LUPerson est un jeu de données non étiqueté comprenant 4 millions d’images provenant de plus de 200 000 identités, soit 30 fois plus volumineux que le plus grand jeu de données Re-ID existant à ce jour. Il couvre également une gamme bien plus diversifiée d’environnements d’acquisition (par exemple, paramètres de caméra, scènes, etc.). À partir de ce jeu de données, nous étudions de manière systématique les facteurs clés pour l’apprentissage de représentations Re-ID sous deux angles : l’augmentation de données et la perte contrastive. L’entraînement non supervisé réalisé sur ce grand jeu de données permet efficacement d’obtenir une représentation Re-ID générique, bénéficiant ainsi à toutes les méthodes existantes de Re-ID de personnes. En utilisant notre modèle pré-entraîné dans des cadres de base, nos approches atteignent des résultats de pointe sans nécessiter de modifications supplémentaires (« bells and whistles ») sur quatre jeux de données Re-ID largement utilisés : CUHK03, Market1501, DukeMTMC et MSMT17. Nos résultats montrent également que l’amélioration des performances est particulièrement marquée sur des jeux de données cibles de petite taille ou dans des scénarios à peu d’exemples (few-shot).