Pyramide avec Résolution Supérieure pour la Reconnaissance d'Expressions Faciales en Situation Réelle
La reconnaissance des expressions faciales (FER) constitue une tâche complexe qui améliore l’interaction homme-machine naturelle. Ce papier se concentre sur la reconnaissance automatique des expressions faciales à partir d’une seule image prise dans le monde réel (in-the-wild, ITW). Les images ITW sont soumises à des problèmes réels liés à l’orientation, à la direction du visage et à la résolution d’entrée. Dans cette étude, nous proposons une architecture de réseau en pyramide avec super-résolution (PSR) afin de résoudre le problème de FER sur images ITW. Nous introduisons également une fonction de perte de lissage des étiquettes par distribution a priori (PDLS), qui intègre des connaissances a priori supplémentaires concernant les confusions fréquentes entre les différentes expressions dans le cadre de la tâche de FER. Des expériences menées sur les trois jeux de données ITW les plus populaires ont montré que notre approche surpasser toutes les méthodes de pointe actuelles.