HyperAIHyperAI

Command Palette

Search for a command to run...

Réseaux U-Dense Empilés avec Deux Transformateurs pour une Alignment Faciale Robuste

Jia Guo*1 Jiankang Deng*2 Niannan Xue2 Stefanos Zafeiriou2

Résumé

La localisation des points de repère faciaux dans des images capturées en conditions réelles est un problème important et difficile. L'état de l'art actuel tourne autour de certains types de Réseaux Neuronaux Convolutifs Profonds (RNCP) tels que les U-Nets empilés et les réseaux Hourglass. Dans ce travail, nous proposons innovamment des U-Nets denses empilés pour cette tâche. Nous concevons une nouvelle structure topologique de réseau d'agrégation d'échelle et un bloc de construction d'agrégation de canaux afin d'améliorer la capacité du modèle sans sacrifier la complexité computationnelle ni la taille du modèle. Avec l'aide des convolutions déformables à l'intérieur des U-Nets denses empilés et d'une perte cohérente pour la transformation des données externes, notre modèle acquiert la capacité d'être spatialement invariant face à des images faciales d'entrée quelconques. De nombreuses expériences sur divers jeux de données en conditions réelles valident la robustesse de la méthode proposée face à des poses extrêmes, des expressions exagérées et des occultations importantes. Enfin, nous montrons que l'alignement facial 3D précis peut aider à la reconnaissance faciale invariante aux poses, où nous atteignons une nouvelle précision record sur le jeu de données CFP-FP.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp