Un ensemble grossier-fin profondément initialisé d'arbres de régression pour l'alignement facial

Dans cet article, nous présentons DCFE, une méthode de régression en temps réel des points de repère faciaux fondée sur un ensemble hiérarchique de forêts de régression (Ensemble of Regression Trees, ERT) de grossier à fin. Nous utilisons un réseau de neurones convolutif (CNN) simple pour générer des cartes de probabilité de localisation des points de repère. Ces cartes sont ensuite affinées par un régresseur ERT, initialement configuré en ajustant un modèle de visage 3D aux cartes de points de repère. La structure hiérarchique de grossier à fin de l’ERT nous permet de traiter l’explosion combinatoire des déformations des parties du visage. Grâce au modèle 3D, nous abordons également d’autres problèmes clés tels qu’une initialisation robuste du régresseur, les occlusions auto-intra, ainsi que l’analyse simultanée de visages en vue frontale et en vue de profil. Les expériences montrent que DCFE obtient les meilleurs résultats rapportés sur les jeux de données AFLW, COFW, ainsi que sur les jeux de données privés et publics du défi 300W.