HyperAIHyperAI
il y a 18 jours

Un nouveau modèle de reconnaissance émotionnelle faciale basé sur l'architecture de segmentation VGG-19

{Rajeswari Sridhar, M. Sridevi, M. Savithadevi, S. Vignesh}
Résumé

La reconnaissance des émotions faciales (FER) a connu une forte popularité ces dernières années en raison de ses nombreuses applications, notamment en biométrie, détection des troubles mentaux, compréhension du comportement humain et profilage psychologique. Toutefois, le développement d’un pipeline FER précis et robuste reste un défi, en raison de nombreux facteurs qui rendent difficile la généralisation entre différentes émotions. Parmi ces facteurs figurent les variations d’orientation du visage, l’hétérogénéité de la structure faciale, l’éclairage, les occlusions, la faible résolution et les effets du vieillissement. De nombreuses approches ont été proposées pour surmonter ces difficultés, telles que le Histogramme de Gradients Orientés (HOG) et l’histogramme de Motifs Binaires Locaux (LBP). Toutefois, ces méthodes nécessitent une sélection manuelle des caractéristiques. Les Réseaux de Neurones Convolutifs (CNN) ont permis de surmonter ce problème de sélection manuelle. Les CNN ont démontré un grand potentiel dans les tâches de FER grâce à leur stratégie d’extraction de caractéristiques unique par rapport aux modèles FER classiques. Dans cet article, nous proposons une nouvelle architecture CNN en intégrant des couches de segmentation U-Net entre les couches du Visual Geometry Group (VGG), afin de permettre au réseau de mettre davantage l’accent sur les caractéristiques les plus critiques extraites des cartes de caractéristiques, tout en contrôlant le flux d’informations redondantes à travers les couches VGG. Notre modèle atteint une précision de pointe (SOTA) en tant que réseau unique par rapport à d’autres modèles FER bien connus sur le jeu de données FER-2013.