HyperAIHyperAI
il y a 17 jours

Apprentissage de l'espérance de la distribution des étiquettes pour l'estimation de l'âge et de l'attractivité faciale

Bin-Bin Gao, Xin-Xin Liu, Hong-Yu Zhou, Jianxin Wu, Xin Geng
Apprentissage de l'espérance de la distribution des étiquettes pour l'estimation de l'âge et de l'attractivité faciale
Résumé

La performance de l'estimation des attributs faciaux (par exemple, l'âge et l'attractivité) a été considérablement améliorée grâce à l'utilisation de réseaux neuronaux convolutifs. Toutefois, les méthodes existantes présentent une incohérence entre les objectifs d'entraînement et les métriques d'évaluation, ce qui peut conduire à des résultats sous-optimaux. En outre, ces approches reposent généralement sur des modèles de classification d'images ou de reconnaissance faciale à très grand nombre de paramètres, entraînant des coûts computationnels élevés et une surcharge de stockage. Dans cet article, nous analysons d'abord la relation fondamentale entre deux méthodes de pointe (Ranking-CNN et DLDL), et montrons que la méthode de classement apprend en réalité implicitement la distribution des étiquettes. Ce résultat permet ainsi, pour la première fois, d'unifier les deux méthodes de pointe existantes dans le cadre de DLDL. Ensuite, afin de réduire l'incohérence entre l'objectif d'entraînement et la métrique d'évaluation, tout en diminuant la consommation de ressources, nous proposons une architecture de réseau léger et un cadre unifié permettant d'apprendre simultanément la distribution des attributs faciaux et de régresser les valeurs associées. L'efficacité de notre approche a été démontrée sur les tâches d'estimation de l'âge facial et de l'attractivité. Notre méthode atteint de nouveaux résultats d'état de l'art en utilisant un unique modèle doté de 36 fois moins de paramètres et trois fois plus rapide en phase d'inférence pour l'estimation de l'âge et de l'attractivité faciale. De plus, même lorsque le nombre de paramètres est réduit à 0,9 million (soit 3,8 Mo d'espace disque), notre méthode parvient à obtenir des résultats comparables à ceux des meilleures méthodes actuelles.