HyperAIHyperAI
il y a 18 jours

Un réseau de caractéristiques mixtes à attention bidirectionnelle pour la reconnaissance d'expressions faciales

{Zhigang Song, YuFei Wang, Ye Zhang, Yuhang Zhang, Saining Zhang}
Résumé

Ces dernières années, la reconnaissance des expressions faciales (FER) a suscité un intérêt croissant au sein des recherches en vision par ordinateur. Ce papier présente un nouveau réseau appelé Réseau à Fonction Mixte à Attentions Bidirectionnelles (DDAMFN), spécifiquement conçu pour la FER, offrant à la fois une robustesse et une légèreté remarquables. L’architecture du réseau se compose de deux composants principaux : le Réseau à Fonction Mixte (MFN), qui sert de squelette, et le Réseau à Attentions Bidirectionnelles (DDAN), qui agit comme tête. Pour renforcer les capacités du MFN, des caractéristiques résilientes sont extraites grâce à l’utilisation de noyaux de tailles mixtes. En outre, une nouvelle tête d’attention bidirectionnelle (DDA) est proposée, générant des cartes d’attention selon deux orientations, permettant ainsi au modèle de capturer efficacement les dépendances à longue portée. Pour améliorer davantage la précision, une nouvelle mécanique de perte d’attention pour le DDAN est introduite, où différentes têtes se concentrent sur des régions distinctes de l’entrée. Des évaluations expérimentales sur plusieurs jeux de données publics largement utilisés, notamment AffectNet, RAF-DB et FERPlus, démontrent l’infériorité du DDAMFN par rapport aux autres modèles existants, établissant ainsi le DDAMFN comme le modèle de pointe dans le domaine de la FER.