HyperAIHyperAI
il y a 2 mois

Architecture de réseau neuronal convolutif siamois à portes pour la réidentification des humains

Rahul Rama Varior; Mrinal Haloi; Gang Wang
Architecture de réseau neuronal convolutif siamois à portes pour la réidentification des humains
Résumé

L'identification de piétons à travers plusieurs vues caméra, connue sous le nom de ré-identification humaine, est un problème de recherche complexe qui présente de nombreuses applications dans la surveillance visuelle. Avec le renouveau des Réseaux Neuronaux Convolutifs (CNNs), plusieurs architectures de CNN profondes Siamese ont été proposées pour la ré-identification humaine, visant à rapprocher les images de paires similaires (c'est-à-dire de même identité) et à éloigner celles des paires dissimilaires. Cependant, les réseaux actuels extraient des représentations fixes pour chaque image, indépendamment des autres images avec lesquelles elles sont appariées, et la comparaison avec d'autres images n'est effectuée qu'au niveau final. Dans ce contexte, le réseau risque de ne pas extraire les motifs locaux fins qui peuvent être essentiels pour distinguer les paires positives des paires négatives difficiles. Dans cet article, nous proposons une fonction de modulation pour mettre en évidence sélectivement ces motifs locaux communs fins en comparant les caractéristiques intermédiaires entre les paires d'images. Cela produit des représentations flexibles pour la même image selon les images avec lesquelles elle est appariée. Nous menons des expériences sur les jeux de données CUHK03, Market-1501 et VIPeR et démontrons une amélioration des performances par rapport à une architecture CNN Siamese de base.