HyperAIHyperAI
il y a 17 jours

Perte auxiliaire basée sur Transformer pour la reconnaissance faciale face aux variations d'âge

Pritesh Prakash, Ashish Jacob Sam, S Umamaheswaran
Perte auxiliaire basée sur Transformer pour la reconnaissance faciale face aux variations d'âge
Résumé

Le vieillissement pose un défi majeur en reconnaissance faciale, car les modifications de la texture et du ton de la peau peuvent altérer les caractéristiques faciales au fil du temps, rendant particulièrement difficile la comparaison d’images prises plusieurs années d’écart pour un même individu, comme dans les scénarios d’identification à long terme. Les réseaux Transformer présentent une capacité à préserver les relations spatiales séquentielles induites par les effets du vieillissement. Ce papier propose une méthode d’évaluation de la perte basée sur un réseau Transformer, intégré comme perte additive dans le domaine de la reconnaissance faciale. La fonction de perte métrique standard prend généralement comme entrée l’embedding final du squelette principal basé sur un CNN. Ici, nous introduisons une perte métrique Transformer, une approche combinée qui intègre à la fois la perte Transformer et la perte métrique. Cette recherche vise à analyser le comportement du Transformer lorsqu’il traite les sorties convolutionnelles, lorsque les résultats du CNN sont organisés sous forme de vecteur séquentiel. Ces vecteurs séquentiels ont le potentiel de surmonter les modifications de texture ou de structure régionale, telles que les rides ou le relâchement cutané, causées par le vieillissement. L’encodeur Transformer prend en entrée des vecteurs contextuels extraits de la dernière couche convolutionnelle du réseau. Les caractéristiques apprises deviennent ainsi plus invariantes au vieillissement, complétant ainsi le pouvoir discriminant de l’embedding issu de la perte métrique classique. Grâce à cette technique, nous combinons la perte Transformer avec diverses fonctions de perte métrique de base afin d’évaluer l’effet des fonctions de perte combinées. Nous observons que cette configuration permet au réseau d’atteindre des résultats de state-of-the-art (SoTA) sur les jeux de données LFW ainsi que sur des jeux de données sensibles au vieillissement (CA-LFW et AgeDB). Cette étude élargit le rôle des Transformers dans le domaine de la vision par ordinateur et ouvre de nouvelles perspectives pour explorer les Transformers comme fonction de perte.

Perte auxiliaire basée sur Transformer pour la reconnaissance faciale face aux variations d'âge | Articles de recherche récents | HyperAI