HyperAIHyperAI
il y a 18 jours

Reconnaissance d'expressions faciales dans le monde réel via une perte attentive centrée profonde

{Xiaojun Qi, Amir Hossein Farzaneh}
Reconnaissance d'expressions faciales dans le monde réel via une perte attentive centrée profonde
Résumé

L’apprentissage de caractéristiques discriminantes pour la reconnaissance des expressions faciales (FER) dans des conditions réelles (« in the wild ») à l’aide de réseaux de neurones convolutifs (CNN) constitue une tâche non triviale en raison des fortes variations intra-classes et des similitudes inter-classes. Les approches d’apprentissage métrique profond (DML), telles que la perte center et ses variantes, combinées à la perte softmax, ont été largement adoptées dans de nombreuses méthodes de FER afin d’améliorer la puissance discriminante des caractéristiques apprises dans l’espace d’embedding. Toutefois, une supervision équitable de toutes les caractéristiques par la méthode d’apprentissage métrique peut inclure des éléments non pertinents, entraînant finalement une dégradation de la capacité de généralisation de l’algorithme. Nous proposons une méthode appelée Deep Attentive Center Loss (DACL), permettant de sélectionner de manière adaptative un sous-ensemble d’éléments de caractéristiques significatifs afin d’améliorer la discrimination. La DACL intègre un mécanisme d’attention pour estimer des poids d’attention corrélés à l’importance des caractéristiques, en utilisant les cartes de caractéristiques spatiales intermédiaires du CNN comme contexte. Ces poids estimés s’insèrent dans une formulation creuse de la perte center, permettant ainsi une compactification intra-classe et une séparation inter-classe sélective pour les informations pertinentes dans l’espace d’embedding. Une étude approfondie menée sur deux jeux de données largement utilisés pour la FER en conditions réelles démontre l’avantage de la méthode proposée par rapport aux approches de pointe.