Un cadre de fusion de distribution adaptative à deux branches pour la reconnaissance d'expressions faciales dans le monde réel
La reconnaissance des expressions faciales (FER) joue un rôle crucial dans notre vie quotidienne. Toutefois, l'ambiguïté des annotations présentes dans les jeux de données peut fortement nuire aux performances des modèles. Dans cet article, nous abordons la tâche de FER à travers un cadre d'apprentissage par distribution de labels, et proposons une architecture à double branche appelée Ada-DF (Adaptive Distribution Fusion). Un premier branche auxiliaire est conçu pour estimer les distributions de labels des échantillons. Ensuite, les distributions de classes émotionnelles sont calculées à partir des distributions de labels associées à chaque émotion. Enfin, ces deux distributions sont fusionnées de manière adaptative en fonction de poids d'attention afin d'entraîner le branche cible. Des expérimentations étendues sont menées sur trois jeux de données réels : RAF-DB, AffectNet et SFEW, où notre méthode Ada-DF montre des performances supérieures aux approches les plus avancées de l'état de l'art. Le code source est disponible à l'adresse suivante : https://github.com/taylor-xy0827/Ada-DF.