Command Palette
Search for a command to run...
Estimation des attributs faciaux hétérogènes : une approche d'apprentissage multi-tâches profond
Estimation des attributs faciaux hétérogènes : une approche d'apprentissage multi-tâches profond
Han Hu Jain Anil K. Wang Fang Shan Shiguang Chen Xilin
Résumé
L’estimation des attributs faciaux présente de nombreuses applications potentielles dans la surveillance vidéo, la recherche d’images faciales et les réseaux sociaux. Bien que plusieurs méthodes aient été proposées pour l’estimation des attributs faciaux, la plupart n’ont pas explicitement pris en compte, lors de l’apprentissage des représentations fonctionnelles, les corrélations entre attributs ni leur hétérogénéité (par exemple, nature ordonnée vs. nominale, ou globale vs. locale). Dans cet article, nous présentons une approche basée sur l’apprentissage multi-tâches profond (Deep Multi-Task Learning, DMTL) permettant d’estimer simultanément plusieurs attributs hétérogènes à partir d’une seule image faciale. Dans le cadre de DMTL, nous traitons à la fois la corrélation entre attributs et leur hétérogénéité en utilisant des réseaux de neurones convolutifs (CNN) composés d’un apprentissage partagé des caractéristiques pour tous les attributs, ainsi que d’un apprentissage spécifique à chaque catégorie pour les attributs hétérogènes. Nous introduisons également une base de données faciales sans contrainte (LFW+), extension de la base publique LFW, comprenant des attributs démographiques hétérogènes (âge, sexe, race) obtenus par crowdsourcing. Les résultats expérimentaux sur plusieurs benchmarks comportant plusieurs attributs faciaux (MORPH II, LFW+, CelebA, LFWA et FotW) montrent que l’approche proposée surpasse les méthodes de pointe. Enfin, les évaluations effectuées sur une base de données publique (LAP) comportant un seul attribut démontrent que la méthode proposée possède une excellente capacité de généralisation.