AnchorFace : un détecteur de points de repère faciaux basé sur des ancres pour des poses larges

La localisation des points de repère faciaux vise à détecter des points prédéfinis sur les visages humains, un domaine qui a connu une amélioration rapide grâce au développement récent des méthodes basées sur les réseaux de neurones. Toutefois, ce problème reste particulièrement difficile dans des scénarios non contraints, notamment en présence de fortes variations d'orientation du visage. Dans cet article, nous nous concentrons sur la localisation des points de repère faciaux sous de grands angles de vue, et proposons une approche fondée sur une stratégie de division et d’agrégation. Pour diviser l’espace de recherche, nous introduisons un ensemble de modèles d’ancres (anchor templates) servant de références pour la régression, permettant ainsi de bien gérer les fortes variations d’orientation du visage. En s’appuyant sur les prédictions fournies par chaque modèle d’ancrage, nous proposons une méthode d’agrégation des résultats, qui permet de réduire l’incertitude des points de repère induite par les grands angles de vue. Globalement, notre méthode, nommée AnchorFace, obtient des performances de pointe sur quatre benchmarks exigeants — AFLW, 300W, Menpo et WFLW — tout en offrant une vitesse d’inférence extrêmement efficace. Le code source sera disponible à l’adresse suivante : https://github.com/nothingelse92/AnchorFace.