il y a 6 mois

Ukrit Watchareeruetai Benjaphan Sommana Sanjana Jain Pavit Noinongyao Ankush Ganguly Aubin Samacoits Samuel W.F. Earp Nakarin Sritrakool

Résumé

Cet article présente un nouveau réseau de localisation de points de repère faciaux basé sur le Transformer, nommé Localization Transformer (LOTR). Le cadre proposé adopte une approche directe de régression de coordonnées, exploitant un réseau Transformer afin d’améliorer l’utilisation de l’information spatiale contenue dans la carte de caractéristiques. Un modèle LOTR se compose de trois modules principaux : 1) un squelette visuel qui transforme une image d’entrée en une carte de caractéristiques, 2) un module Transformer qui améliore la représentation des caractéristiques issue du squelette visuel, et 3) une tête de prédiction des points de repère qui prédit directement les coordonnées des points à partir de la représentation du Transformer. À partir d’images faciales découpées et alignées, le modèle LOTR peut être entraîné de manière end-to-end, sans nécessiter d’étapes de post-traitement. Cet article introduit également une fonction de perte lisse appelée smooth-Wing, qui résout la discontinuité des gradients présente dans la perte Wing, permettant une convergence plus stable que les fonctions de perte classiques telles que L1, L2 ou Wing. Les résultats expérimentaux sur le jeu de données JD, fourni par le Premier Défi du Grand Défi de Localisation des Points de Repère Faciaux à 106 points, démontrent l’avantage de LOTR par rapport aux méthodes existantes sur le classement ainsi qu’à deux approches récentes basées sur les cartes de chaleur. Sur le jeu de données WFLW, le cadre LOTR proposé obtient des résultats prometteurs comparés à plusieurs méthodes de pointe. En outre, nous rapportons une amélioration des performances actuelles en reconnaissance faciale lorsqu’utilisant nos modèles LOTR pour l’alignement facial.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 6 mois

Transformer

Vision Par Ordinateur

Reconnaissance Faciale

Approche/Framework

Vision Par Ordinateur

Tâche

Ukrit Watchareeruetai Benjaphan Sommana Sanjana Jain Pavit Noinongyao Ankush Ganguly Aubin Samacoits Samuel W.F. Earp Nakarin Sritrakool

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 6 mois

Transformer

Vision Par Ordinateur

Reconnaissance Faciale

Approche/Framework

Vision Par Ordinateur

Tâche

Ukrit Watchareeruetai Benjaphan Sommana Sanjana Jain Pavit Noinongyao Ankush Ganguly Aubin Samacoits Samuel W.F. Earp Nakarin Sritrakool

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

LOTR : Localisation des points de repère faciaux à l’aide d’un Transformer de localisation

Ukrit Watchareeruetai Benjaphan Sommana Sanjana Jain Pavit Noinongyao Ankush Ganguly Aubin Samacoits Samuel W.F. Earp Nakarin Sritrakool

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

LOTR : Localisation des points de repère faciaux à l’aide d’un Transformer de localisation

Ukrit Watchareeruetai Benjaphan Sommana Sanjana Jain Pavit Noinongyao Ankush Ganguly Aubin Samacoits Samuel W.F. Earp Nakarin Sritrakool

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

LOTR : Localisation des points de repère faciaux à l’aide d’un Transformer de localisation

Ukrit Watchareeruetai Benjaphan Sommana Sanjana Jain Pavit Noinongyao Ankush Ganguly Aubin Samacoits Samuel W.F. Earp Nakarin Sritrakool

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters