Deep Expectation de l'Âge Réel et Apparent à Partir d'une Seule Image Sans Points Faciaux

Dans cet article, nous proposons une solution basée sur l’apprentissage profond pour l’estimation de l’âge à partir d’une seule image faciale, sans recourir à des repères faciaux, et introduisons le jeu de données IMDB-WIKI, le plus grand ensemble de données public d’images faciales étiquetées avec l’âge et le sexe. Si la recherche sur l’estimation de l’âge réel remonte à plusieurs décennies, l’étude de l’estimation de l’âge apparent — c’est-à-dire l’âge perçu par les humains à partir d’une image faciale — est une entreprise récente. Nous abordons ces deux tâches à l’aide de réseaux de neurones convolutifs (CNN) de type VGG-16, pré-entraînés sur ImageNet pour la classification d’images. Nous formulons le problème d’estimation de l’âge comme un problème de classification profonde suivi d’un raffinement par valeur attendue via une fonction softmax. Les principaux éléments de notre approche sont : des modèles appris profondément à partir de grandes quantités de données, une alignment faciale robuste, et une formulation par valeur attendue pour la régression d’âge. Nous validons nos méthodes sur des benchmarks standards et obtenons des résultats de pointe pour les deux tâches, à savoir l’estimation de l’âge réel et celle de l’âge apparent.