Estimation hiérarchique de l'âge et estimation du biais basées sur l'attention

Dans ce travail, nous proposons une nouvelle approche fondée sur l'apprentissage profond pour l'estimation de l'âge à partir d'images faciales. Nous introduisons tout d'abord une méthode originale d'augmentation et d'agrégation d'images doubles basée sur l'attention. Cette approche permet au réseau de tirer parti conjointement de plusieurs augmentations d'images faciales, dont les représentations (embeddings) sont agrégées par un encodeur Transformer. L'embedding agrégé obtenu s'avère mieux encoder les caractéristiques de l'image faciale. Nous proposons ensuite un cadre de régression hiérarchique probabiliste, combinant une estimation discrète probabiliste des étiquettes d'âge avec un ensemble de régresseurs associés. Chaque régresseur est spécifiquement adapté et entraîné pour affiner l'estimation probabiliste sur un intervalle donné d'âge. Notre méthode est démontrée comme surpassant les approches actuelles et atteignant une nouvelle performance de pointe en précision d'estimation de l'âge, lorsqu'elle est appliquée au jeu de données MORPH II. Enfin, nous présentons une analyse des biais des résultats d'estimation de l'âge les plus avancés à ce jour.