HyperAIHyperAI
il y a 18 jours

Transformateur sensible au modèle pour la réidentification de personnes

{Dongxiao Yu, Xiaowei Yu, Zengrui Zhao, Yanwei Zheng}
Résumé

La réidentification de personnes (ReID) est une tâche difficile en vision par ordinateur, visant à identifier ou vérifier une ou plusieurs personnes lorsque les visages ne sont pas disponibles. En ReID, le fond indistinguable affecte souvent la perception du modèle en ce qui concerne le premier plan, ce qui réduit les performances du système. En général, le fond d'une même caméra est similaire, tandis que celui de caméras différentes diffère fortement. À partir de cette observation, nous proposons une méthode appelée Transformer à modèle conscient (TAT), qui permet d'apprendre des caractéristiques indistinguables entre échantillons en introduisant un modèle apprenable dans la structure du transformer, afin de réduire l'attention du modèle portée sur les régions à faible discriminabilité, telles que les fonds et les occlusions. Dans le module d'attention à plusieurs têtes de l'encodeur, ce modèle dirige une attention consciente du modèle vers les caractéristiques indistinguables de l'image, tout en augmentant progressivement l'attention portée aux caractéristiques distinguables à mesure que les blocs de l'encodeur s'approfondissent. Nous augmentons également le nombre de modèles en exploitant des informations auxiliaires, en tenant compte des spécificités des tâches de ReID, afin d’adapter le modèle aux fonds qui varient fortement selon les identifiants de caméra. Enfin, nous démontrons la validité de nos hypothèses à l’aide de diverses bases de données publiques et obtenons des résultats compétitifs grâce à une évaluation quantitative.

Transformateur sensible au modèle pour la réidentification de personnes | Articles de recherche récents | HyperAI