Méthode de descente supervisée et ses applications à l'alignement facial

De nombreux problèmes de vision par ordinateur (par exemple, la calibration de caméra, l’alignement d’images, la reconstruction 3D à partir du mouvement) sont résolus à l’aide de méthodes d’optimisation non linéaire. Il est généralement admis que les méthodes de descente du second ordre constituent les approches les plus robustes, rapides et fiables pour l’optimisation non linéaire d’une fonction lisse générale. Toutefois, dans le contexte de la vision par ordinateur, ces méthodes présentent deux inconvénients majeurs : (1) la fonction peut ne pas être analytiquement différentiable, rendant les approximations numériques impraticables ; (2) la matrice hessienne peut être de grande taille et non définie positive. Pour surmonter ces limitations, cet article propose une méthode de descente supervisée (Supervised Descent Method, SDM) destinée à minimiser une fonction de moindres carrés non linéaires (Non-linear Least Squares, NLS). Lors de l’apprentissage, la SDM apprend une séquence de directions de descente qui minimise la moyenne de fonctions NLS échantillonnées à différents points. En phase de test, la SDM minimise l’objectif NLS en utilisant uniquement les directions de descente apprises, sans calculer ni le jacobien ni la hessienne. Nous illustrons les avantages de notre approche à travers des exemples synthétiques et réels, et démontrons que la SDM atteint un niveau d’expertise de pointe dans le problème de détection des caractéristiques faciales. Le code est disponible à l’adresse suivante : www.humansensing.cs.cmu.edu/intraface.