Command Palette
Search for a command to run...
Réseau de alignement des piétons pour la réidentification à grande échelle de personnes
Réseau de alignement des piétons pour la réidentification à grande échelle de personnes
Zheng Zhedong Zheng Liang Yang Yi
Résumé
La réidentification de personnes (person re-ID) est principalement considérée comme un problème de recherche d’images. Cette tâche vise à localiser une personne de requête au sein d’un grand ensemble d’images. En pratique, la réidentification de personnes utilise généralement des détecteurs automatiques pour extraire des images coupées de piétons. Toutefois, ce processus est sujet à deux types d’erreurs de détection : la présence excessive de fond et la perte de parties du corps. Ces deux erreurs détériorent la qualité de l’alignement des piétons et peuvent compromettre la correspondance entre piétons en raison des variations de position et d’échelle. Pour résoudre ce problème d’alignement incorrect, nous proposons d’apprendre l’alignement à partir d’un processus d’identification. Nous introduisons le réseau d’alignement de piétons (PAN), qui permet d’apprendre des représentations discriminantes et d’aligner les piétons sans nécessiter d’étiquettes supplémentaires. Notre observation clé est que, lorsqu’un réseau neuronal à convolution (CNN) apprend à distinguer différentes identités, les cartes de caractéristiques apprises présentent généralement des activations fortes sur le corps humain plutôt que sur le fond. Le réseau proposé exploite ainsi ce mécanisme d’attention pour localiser et aligner de manière adaptative les piétons à l’intérieur d’une boîte englobante. Des exemples visuels montrent que les piétons sont mieux alignés grâce au PAN. Des expériences menées sur trois grands jeux de données de réidentification confirment que PAN améliore la capacité discriminante des représentations ensemblistes et atteint une précision compétitive par rapport aux méthodes de pointe actuelles.