HyperAIHyperAI
il y a 2 mois

Réflexion sur la réidentification des personnes sous l'angle de la projection sur des prototypes

Qizao Wang; Xuelin Qian; Bin Li; Yanwei Fu; Xiangyang Xue
Réflexion sur la réidentification des personnes sous l'angle de la projection sur des prototypes
Résumé

La tâche de réidentification de personnes (Re-ID) a connu un développement considérable au cours de la dernière décennie. Les méthodes actuelles les plus avancées suivent un cadre analogue consistant d'abord à extraire des caractéristiques des images d'entrée, puis à les catégoriser à l'aide d'un classifieur. Cependant, comme il n'y a pas de chevauchement d'identités entre les ensembles d'entraînement et de test, le classifieur est souvent écarté lors de l'inférence. Seules les caractéristiques extraites sont utilisées pour la réidentification de personnes via des métriques de distance. Dans cet article, nous repensons le rôle du classifieur dans la réidentification de personnes et proposons une nouvelle perspective qui consiste à concevoir le classifieur comme une projection des caractéristiques d'image vers des prototypes de classe. Ces prototypes correspondent exactement aux paramètres appris par le classifieur. À cette lumière, nous décrivons l'identité des images d'entrée en termes de similarités avec tous les prototypes, qui sont ensuite utilisés comme caractéristiques plus discriminantes pour effectuer la réidentification de personnes. Nous proposons donc une nouvelle ligne de base appelée ProNet, qui conserve innovativement la fonction du classifieur lors de l'étape d'inférence. Pour faciliter l'apprentissage des prototypes de classe, tant la perte par triplet que la perte de classification d'identité sont appliquées aux caractéristiques qui subissent la projection par le classifieur. Une version améliorée nommée ProNet++ est présentée en intégrant davantage des conceptions multi-granularités. Des expériences menées sur quatre bancs d'essai montrent que notre ProNet proposé est simple mais efficace, et surpass significativement les lignes de base précédentes. ProNet++ obtient également des résultats compétitifs ou même meilleurs que ceux des concurrents basés sur les transformers.

Réflexion sur la réidentification des personnes sous l'angle de la projection sur des prototypes | Articles de recherche récents | HyperAI