HyperAIHyperAI
il y a 18 jours

Réseau léger robuste pour la reconnaissance d'expressions faciales avec apprentissage par distribution des étiquettes

{Feng Zhou, Qingshan Liu, Zengqun Zhao}
Résumé

Cet article présente un réseau efficace et robuste pour la reconnaissance des expressions faciales (FER), nommé EfficientFace, qui possède un nombre beaucoup plus réduit de paramètres tout en étant plus robuste face aux conditions réelles (FER « in the wild »). Tout d’abord, afin d’améliorer la robustesse du réseau léger, un extracteur de caractéristiques locales et un modulateur canal-espace ont été conçus, utilisant une convolution depthwise. Ce choix permet au réseau de prendre en compte à la fois les caractéristiques faciales locales et globalement saillantes. Ensuite, compte tenu du fait que la plupart des émotions se manifestent sous forme de combinaisons, de mélanges ou de composés des émotions fondamentales, nous introduisons une méthode simple mais efficace d’apprentissage de la distribution des étiquettes (Label Distribution Learning, LDL) comme nouvelle stratégie d’entraînement. Des expériences menées sur des jeux de données réalistes présentant des occlusions et des variations d’orientation montrent que le modèle EfficientFace est robuste face à ces conditions. En outre, la méthode proposée atteint des résultats de pointe sur les jeux de données RAF-DB, CAER-S et AffectNet-7, avec des précisions respectives de 88,36 %, 85,87 % et 63,70 %, ainsi qu’un résultat comparable sur AffectNet-8, avec une précision de 59,89 %.