FacePoseNet : Plaidoyer pour un Alignement Facial sans Points de Repère

Nous démontrons comment un réseau neuronal convolutif (CNN) simple peut être formé pour régresser de manière précise et robuste la posture de tête 3D à six degrés de liberté (6DoF), directement à partir des intensités d'image. Nous expliquons également comment ce FacePoseNet (FPN) peut être utilisé pour aligner les visages en 2D et en 3D, comme une alternative à la détection explicite des points caractéristiques faciaux pour ces tâches. Nous soutenons que dans de nombreux cas, les méthodes standards de mesure de la précision du détecteur de points caractéristiques peuvent être trompeuses lorsqu'elles sont utilisées pour comparer différents alignements faciaux. À la place, nous comparons notre FPN avec les méthodes existantes en évaluant leur impact sur la précision de la reconnaissance faciale sur les bancs d'essai IJB-A et IJB-B : en utilisant le même pipeline de reconnaissance, mais en variant la méthode d'alignement facial. Nos résultats montrent que (a) une meilleure précision de détection des points caractéristiques mesurée sur le banc d'essai 300W n'implique pas nécessairement une meilleure précision de reconnaissance faciale. (b) Notre FPN fournit un alignement facial supérieur en 2D et en 3D sur les deux bancs d'essai. Enfin, (c), l'alignement des visages par FPN se fait à un coût computationnel beaucoup plus faible que celui des détecteurs de points caractéristiques comparables en termes de précision. Pour de nombreuses applications, le FPN est donc une méthode d'alignement facial bien plus rapide et bien plus précise que l'utilisation des détecteurs de points caractéristiques faciaux.