HyperAIHyperAI
il y a 2 mois

Apprentissage de Caractéristiques Profondes par Comparaison de Distance Relative pour la Ré-identification des Personnes

Shengyong Ding; Liang Lin; Guangrun Wang; Hongyang Chao
Apprentissage de Caractéristiques Profondes par Comparaison de Distance Relative pour la Ré-identification des Personnes
Résumé

L'identification de la même personne dans différentes scènes est une tâche importante mais difficile dans le domaine de la vidéosurveillance intelligente. Sa principale difficulté réside dans la manière de préserver la similarité d'une même personne malgré de grandes variations d'apparence et de structure, tout en distinguant différentes individus. Dans cet article, nous présentons un cadre d'apprentissage de caractéristiques basé sur les réseaux neuronaux profonds, qui est évolutif et guidé par la distance, pour l'identification de personnes, et nous démontrons son efficacité pour relever les défis existants. Plus précisément, étant données des images d'entraînement avec des étiquettes de classe (identifiants de personnes), nous produisons d'abord un grand nombre d'unités triplettes, chacune contenant trois images, soit une personne avec une référence correspondante et une référence non correspondante. En traitant ces unités comme entrée, nous construisons un réseau neuronal convolutif pour générer des représentations à plusieurs niveaux, suivies par une métrique de distance $L2$. Par l'optimisation des paramètres, notre cadre tend à maximiser la distance relative entre le couple correspondant et le couple non correspondant pour chaque unité tripartite. De plus, un problème non trivial qui se pose avec ce cadre est que l'organisation en triplets augmente cubiquement le nombre d'unités triplettes d'entraînement, car une image peut être impliquée dans plusieurs unités triplettes. Pour surmonter ce problème, nous avons développé un schéma efficace de génération de triplets et un algorithme optimisé de descente du gradient, rendant ainsi la charge computationnelle principalement dépendante du nombre d'images originales plutôt que du nombre de triplets. Sur plusieurs bases de données difficiles, notre approche obtient des résultats très prometteurs et surpasses les autres approches les plus avancées.

Apprentissage de Caractéristiques Profondes par Comparaison de Distance Relative pour la Ré-identification des Personnes | Articles de recherche récents | HyperAI