Analyse de la beauté faciale basée sur la prédiction de distribution et les ensembles de CNN
La prédiction de la beauté faciale (FBP) est une tâche de vision par ordinateur consistant à quantifier la beauté d’un visage. Plusieurs approches à ce problème ont grandement bénéficié des récents progrès du deep learning. Toutefois, la majorité des méthodes actuelles entraînent des modèles d’apprentissage automatique afin de prédire uniquement des scores moyens de beauté, traitant la FBP comme une simple tâche de régression. En outre, les approches basées sur le deep learning pour la FBP utilisent jusqu’à présent le transfer learning à partir de modèles entraînés sur des tâches de classification générales, telles que ImageNet. Nous proposons de fin-tuner un ensemble de modèles de réseaux de neurones convolutifs (CNN), initialement entraînés sur des tâches de vérification faciale, en utilisant une variété de fonctions de perte, notamment une fonction de perte basée sur la distance de Wasserstein (Earth Mover’s Distance, EMD). Grâce à cette approche, notre méthode permet de prédire la distribution complète des scores de beauté, et non seulement la moyenne, et les scores moyens prédits présentent une corrélation de Pearson (PC) plus élevée par rapport aux scores réels. Cette méthode atteint des résultats de pointe sur le jeu de données MEBeauty en termes d’erreur absolue moyenne, d’erreur quadratique moyenne et de corrélation de Pearson entre les scores moyens prédits et les scores réels.