Perte moyenne-variabilité pour l'estimation profonde de l'âge à partir d'un visage

L’estimation de l’âge présente de larges perspectives d’applications dans de nombreux domaines, tels que la surveillance vidéo, les réseaux sociaux ou l’interaction homme-machine. Toutefois, de nombreuses méthodes publiées traitent l’estimation de l’âge comme un problème de régression vers une valeur exacte, sans exploiter la robustesse des distributions pour représenter des étiquettes ambigües telles que l’âge. Dans cet article, nous proposons une nouvelle fonction de perte, appelée perte moyenne-écart-type, pour une estimation robuste de l’âge basée sur l’apprentissage de distributions. Plus précisément, la perte moyenne-écart-type se compose d’une perte moyenne, qui pénalise l’écart entre la moyenne de la distribution estimée de l’âge et l’âge réel (ground-truth), et d’une perte d’écart-type, qui pénalise la variance de la distribution estimée afin d’assurer une concentration de la distribution. La perte moyenne-écart-type proposée est combinée à la perte softmax dans des réseaux de neurones convolutifs (CNN) pour l’estimation de l’âge, et les poids du réseau sont optimisés via la descente de gradient stochastique (SGD) dans une approche d’apprentissage end-to-end. Les résultats expérimentaux sur plusieurs bases de données difficiles de vieillissement facial (FG-NET, MORPH Album II et CLAP2016) montrent que la méthode proposée surpasser largement les approches de pointe, même avec un seul modèle.