SCAF : Connexions d'évitement dans un auto-encodeur pour l'alignement facial avec peu de données annotées

Les méthodes supervisées d’alignement facial nécessitent de grandes quantités de données d’entraînement afin d’obtenir de bonnes performances en termes d’exactitude et de généralisation. Toutefois, les jeux de données d’alignement facial comptent rarement plus quelques milliers d’échantillons, ce qui rend ces méthodes sujettes au surapprentissage sur le jeu d’entraînement spécifique. Des méthodes semi-supervisées telles que TS3 ou 3FabRec sont apparues afin de pallier ce problème en exploitant à la fois des données étiquetées et non étiquetées pendant l’entraînement. Dans cet article, nous proposons SCAF (Skip-Connections in Auto-encoder for Face alignment), une méthode qui s’appuie sur 3FabRec en ajoutant des connexions directes (skip-connections) entre l’encodeur et le décodeur. Ces connexions permettent d’améliorer significativement la prédiction des points d’ancrage, en particulier sur des exemples difficiles. Nous introduisons également, pour la première fois dans le domaine de l’alignement facial, l’apprentissage actif, accompagné d’une nouvelle fonction d’acquisition, appelée Magnitude du Voisinage Négatif, spécifiquement conçue pour évaluer la qualité des cartes de chaleur. Les deux propositions s’avèrent efficaces sur plusieurs jeux de données d’alignement facial lorsqu’elles sont entraînées avec un nombre limité de données.