GReFEL : Apprentissage fiable des expressions faciales prenant en compte la géométrie sous biais et distribution de données déséquilibrée

L'apprentissage fiable des expressions faciales (FEL) implique une apprentissage efficace des caractéristiques distinctives des expressions faciales pour des prédictions plus fiables, non biaisées et précises dans des situations réelles. Cependant, les systèmes actuels peinent à accomplir les tâches de FEL en raison de la variabilité des expressions faciales dues aux structures faciales uniques, aux mouvements, aux tons et aux caractéristiques démographiques des individus. Les jeux de données biaisés et déséquilibrés aggravent ce défi, entraînant des étiquettes de prédiction erronées et biaisées. Pour relever ces défis, nous présentons GReFEL, qui utilise les Transformers visuels et un module d'équilibre de fiabilité basé sur l'ancrage et sensible à la géométrie faciale pour lutter contre les distributions de données déséquilibrées, le biais et l'incertitude dans l'apprentissage des expressions faciales. En intégrant les données locales et globales avec des ancres qui apprennent différents points de données faciaux et caractéristiques structurelles, notre approche ajuste les émotions biaisées ou mal étiquetées causées par la disparité intra-classe, la similarité inter-classes et la sensibilité à l'échelle, aboutissant ainsi à des prédictions d'expressions faciales complètes, précises et fiables. Notre modèle surpasses les méthodologies actuelles de pointe, comme le montrent de nombreuses expériences menées sur divers jeux de données.