il y a 6 mois

Résumé

Cet article présente IP-SLT, un cadre simple mais efficace pour la traduction de la langue des signes (SLT). Notre approche IP-SLT repose sur une structure récurrente et améliore la représentation sémantique (prototype) de la vidéo signée d'entrée par une méthode itérative de raffinement. L'idée s'inspire du comportement de lecture humaine, où une phrase peut être traitée de manière répétée jusqu'à atteindre une compréhension précise. Techniquement, IP-SLT se compose de trois composants : extraction de caractéristiques, initialisation du prototype et raffinement itératif du prototype. Le module d'initialisation génère un prototype initial à partir des caractéristiques visuelles extraites par le module d'extraction. Ensuite, le module de raffinement itératif utilise un mécanisme d'attention croisée pour affiner le prototype précédent en l'agrégant avec les caractéristiques vidéo d'origine. Par un processus de raffinement répété, le prototype converge progressivement vers un état plus stable et plus précis, permettant ainsi une traduction fluide et appropriée. Par ailleurs, afin d’exploiter la dépendance séquentielle des prototypes, nous proposons également une perte de distillation itérative, visant à transférer les connaissances de la dernière itération vers les itérations antérieures. Étant donné que le processus de décodage auto-régressif n’est exécuté qu’une seule fois lors de l’inférence, IP-SLT peut être facilement intégré à divers systèmes de SLT avec un surcoût acceptable. Des expériences abondantes ont été menées sur des benchmarks publics afin de démontrer l’efficacité de IP-SLT.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

il y a 6 mois

Vision Par Ordinateur

Tâche

Huijie Yao Wengang Zhou Hao Feng Hezhen Hu Hao Zhou Houqiang Li

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

il y a 6 mois

Vision Par Ordinateur

Tâche

Huijie Yao Wengang Zhou Hao Feng Hezhen Hu Hao Zhou Houqiang Li

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Traduction de la langue des signes avec un prototype itératif | Articles | HyperAI

Command Palette

Traduction de la langue des signes avec un prototype itératif

Huijie Yao Wengang Zhou Hao Feng Hezhen Hu Hao Zhou Houqiang Li

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Traduction de la langue des signes avec un prototype itératif

Huijie Yao Wengang Zhou Hao Feng Hezhen Hu Hao Zhou Houqiang Li

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Traduction de la langue des signes avec un prototype itératif

Huijie Yao Wengang Zhou Hao Feng Hezhen Hu Hao Zhou Houqiang Li

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters