Perte d'ailes pour une localisation robuste des points caractéristiques faciaux avec des réseaux de neurones convolutifs

Nous présentons une nouvelle fonction de perte, appelée Wing loss, pour une localisation robuste des points caractéristiques faciaux avec des Réseaux Neuronaux Convolutifs (CNNs). Nous commençons par comparer et analyser différentes fonctions de perte, notamment L2, L1 et smooth L1. Cette analyse suggère que, pour l'entraînement d'un modèle de localisation basé sur les CNNs, il convient de porter davantage d'attention aux erreurs de petite et moyenne amplitude. À cette fin, nous concevons une fonction de perte par morceaux. La nouvelle fonction de perte amplifie l'impact des erreurs dans l'intervalle (-w, w) en passant de la perte L1 à une fonction logarithmique modifiée.Pour résoudre le problème de sous-représentation des échantillons avec de grandes rotations hors-plan de la tête dans l'ensemble d'entraînement, nous proposons une stratégie d'amplification simple mais efficace, appelée équilibrage des données basé sur la pose. Plus précisément, nous abordons le problème d'imbalance des données en dupliquant les échantillons minoritaires d'entraînement et en les perturbant en injectant des rotations aléatoires d'image, des translations de boîte englobante et d'autres approches d'augmentation de données. Enfin, l'approche proposée est étendue pour créer un cadre en deux étapes pour une localisation robuste des points caractéristiques faciaux.Les résultats expérimentaux obtenus sur les bases AFLW et 300W démontrent les avantages de la fonction de perte Wing loss et prouvent la supériorité de notre méthode par rapport aux approches les plus avancées actuellement disponibles.