Apprentissage de caractéristiques discriminantes à multiples granularités pour la réidentification des personnes

La combinaison de caractéristiques globales et partielles a été une solution essentielle pour améliorer les performances discriminantes dans les tâches de ré-identification des personnes (Re-ID). Les méthodes précédentes basées sur les parties se concentrent principalement sur la localisation de régions avec des sémantiques spécifiquement pré-définies pour apprendre des représentations locales, ce qui augmente la difficulté d'apprentissage mais n'est pas efficace ou robuste face à des scénarios présentant de grandes variations. Dans cet article, nous proposons une stratégie d'apprentissage de caractéristiques intégrée de bout en bout, combinant des informations discriminantes à différents niveaux de granularité. Nous avons soigneusement conçu le Réseau à Multi-Granularités (MGN), une architecture de réseau profond multi-branche composée d'une branche pour les représentations de caractéristiques globales et de deux branches pour les représentations de caractéristiques locales. Au lieu d'apprendre sur des régions sémantiques, nous partitionnons uniformément les images en plusieurs bandes et modifions le nombre de parties dans différentes branches locales pour obtenir des représentations de caractéristiques locales à multiples granularités. Des expériences exhaustives menées sur les ensembles de données d'évaluation principaux, tels que Market-1501, DukeMTMC-reID et CUHK03, indiquent que notre méthode a atteint robustement des performances d'état de l'art et surpassé largement toutes les approches existantes. Par exemple, sur l'ensemble de données Market-1501 en mode requête unique, nous obtenons un résultat d'état de l'art avec un taux Rank-1/mAP = 96,6 % / 94,2 % après reclassement.