Ad-Corre : Pertes adaptatives basées sur la corrélation pour la reconnaissance des expressions faciales dans des conditions réelles
La reconnaissance automatique des expressions faciales (FER) dans des environnements naturels (« in the wild ») à l’aide de réseaux neuronaux profonds reste un défi en raison des variations intra-classes et des similitudes inter-classes présentes dans les images faciales. L’apprentissage métrique profond (Deep Metric Learning, DML) est l’une des méthodes largement utilisées pour atténuer ces difficultés en améliorant la puissance discriminative des caractéristiques intégrées apprises. Ce papier propose une nouvelle fonction de perte, nommée Ad-Corre Loss, conçue pour guider le réseau à produire des vecteurs de caractéristiques intégrées fortement corrélés pour les échantillons appartenant à la même classe, tout en réduisant la corrélation entre les vecteurs de caractéristiques provenant de classes différentes. L’Ad-Corre Loss se compose de trois composants : le Discriminateur de Caractéristiques, le Discriminateur de Moyennes et le Discriminateur d’Intégration. Le premier composant oriente le réseau afin qu’il génère des vecteurs de caractéristiques intégrées fortement corrélés lorsqu’ils proviennent de classes similaires, et faiblement corrélés pour des classes distinctes. Le second composant pousse le réseau à rendre les vecteurs moyens des caractéristiques intégrées de différentes classes aussi peu similaires que possible. Nous utilisons le réseau Xception comme architecture principale (backbone) de notre modèle. Contrairement aux travaux antérieurs, nous proposons un espace de caractéristiques intégrées contenant k vecteurs distincts. Le troisième composant, le Discriminateur d’Intégration, pénalise le réseau lorsqu’il produit des vecteurs de caractéristiques intégrées trop dissimilaires. Notre modèle est entraîné en combinant la fonction de perte proposée (Ad-Corre Loss) avec la fonction de perte par entropie croisée. Nous obtenons des résultats très prometteurs en termes de précision de reconnaissance sur les bases de données AffectNet, RAF-DB et FER-2013. Nos expériences approfondies ainsi que notre étude d’ablation démontrent la robustesse et l’efficacité de notre méthode face aux défis posés par la FER dans des conditions réelles.