Alignement Facial à Grande Échelle : Une Solution 3D

L'alignement facial, qui consiste à ajuster un modèle de visage à une image et à extraire les significations sémantiques des pixels faciaux, est un sujet important dans la communauté de traitement d'image (CV). Cependant, la plupart des algorithmes sont conçus pour des visages présentant des poses de petite à moyenne amplitude (inférieure à 45 degrés), manquant ainsi de la capacité d'aligner des visages en poses larges allant jusqu'à 90 degrés. Les défis sont triples : premièrement, le modèle facial basé sur les points caractéristiques (landmarks) couramment utilisé suppose que tous les points sont visibles, ce qui le rend inadapté aux vues en profil. Deuxièmement, l'apparence du visage varie beaucoup plus considérablement en fonction des grandes poses, passant d'une vue frontale à une vue en profil. Troisièmement, l'étiquetage des points caractéristiques en grandes poses est extrêmement difficile car il faut deviner les points invisibles. Dans cet article, nous proposons une solution aux trois problèmes au sein d'un nouveau cadre d'alignement appelé Alignement Facial Densément 3D (3DDFA), dans lequel un modèle de visage 3D dense est ajusté à l'image par le biais d'un réseau neuronal convolutif (CNN). Nous proposons également une méthode pour synthétiser des échantillons d'entraînement à grande échelle en vues de profil afin de résoudre le problème d'étiquetage des données. Les expériences menées sur la base de données AFLW montrent que notre approche réalise des améliorations significatives par rapport aux méthodes les plus avancées actuellement disponibles.