HyperAIHyperAI
il y a 18 jours

Un modèle léger améliorant la reconnaissance des expressions faciales grâce à un biais spatial et une perte cosinus-harmonieuse

{Liangyu Huang, Xuefeng Chen}
Résumé

Cet article propose un nouveau réseau de reconnaissance d’expressions faciales appelé Lightweight Facial Network with Spatial Bias (LFNSB). Le modèle LFNSB équilibre efficacement la complexité du modèle et la précision de reconnaissance. Il se compose de deux composants clés : un réseau léger d'extraction de caractéristiques (LFN) et un module Spatial Bias (SB) permettant d’agréger des informations globales. Le LFN intègre des opérations combinées sur les canaux et des techniques de convolution depthwise, réduisant ainsi de manière efficace le nombre de paramètres tout en améliorant la capacité de représentation des caractéristiques. Le module Spatial Bias permet au modèle de se concentrer sur les caractéristiques locales du visage tout en capturant les dépendances entre différentes régions faciales. Par ailleurs, une nouvelle fonction de perte, nommée Cosine-Harmony Loss, a été conçue. Cette fonction optimise les positions relatives des vecteurs de caractéristiques dans l’espace à haute dimension, conduisant à une meilleure séparation et regroupement des caractéristiques. Les résultats expérimentaux sur les jeux de données AffectNet et RAF-DB montrent que le modèle LFNSB proposé se distingue particulièrement dans les tâches de reconnaissance d’expressions faciales. Il atteint une haute précision de reconnaissance tout en réduisant de manière significative le nombre de paramètres, réduisant ainsi considérablement la complexité du modèle.