HyperAIHyperAI
il y a 4 mois

Réseau d'Attention Spatiale Sans Paramètre pour la Ré-Identification des Personnes

Haoran Wang; Yue Fan; Zexin Wang; Licheng Jiao; Bernt Schiele
Réseau d'Attention Spatiale Sans Paramètre pour la Ré-Identification des Personnes
Résumé

Le pooling moyen global (GAP) permet de localiser les informations discriminantes pour la reconnaissance [40]. Bien que le GAP aide le réseau neuronal convolutif à se concentrer sur les caractéristiques les plus discriminantes d'un objet, il peut souffrir si ces informations sont absentes, par exemple en raison de changements de point de vue de la caméra. Pour contourner ce problème, nous soutenons qu'il est avantageux de prêter attention à la configuration globale de l'objet en modélisant les relations spatiales entre les caractéristiques de haut niveau. Nous proposons une nouvelle architecture pour la réidentification des personnes, basée sur une couche d'attention spatiale sans paramètre introduisant des relations spatiales entre les activations des cartes de caractéristiques dans le modèle. Notre couche d'attention spatiale améliore constamment les performances par rapport au modèle sans elle. Les résultats sur quatre benchmarks démontrent la supériorité de notre modèle par rapport à l'état de l'art, atteignant une précision du premier rang de 94,7 % sur Market-1501, 89,0 % sur DukeMTMC-ReID, 74,9 % sur CUHK03-labeled et 69,7 % sur CUHK03-detected.