HyperAIHyperAI

Command Palette

Search for a command to run...

Traduction neuronale de mots rares avec des unités sous-motiales

Rico Sennrich; Barry Haddow; Alexandra Birch

Résumé

Les modèles de traduction automatique neuronale (NMT) fonctionnent généralement avec un vocabulaire fixe, mais la traduction est un problème à vocabulaire ouvert. Les travaux antérieurs abordent la traduction des mots hors du vocabulaire en recourant à un dictionnaire. Dans cet article, nous présentons une approche plus simple et efficace, permettant au modèle NMT de réaliser une traduction à vocabulaire ouvert en codant les mots rares et inconnus comme des séquences d'unités sous-mot. Cette approche repose sur l'intuition que diverses classes de mots sont traduisibles par des unités plus petites que les mots, par exemple les noms (par copie de caractères ou translittération), les composés (par traduction compositionnelle) et les mots apparentés et empruntés (par transformations phonologiques et morphologiques). Nous discutons de l'adéquation de différentes techniques de segmentation lexicale, notamment des modèles simples de n-grammes de caractères et d'une segmentation basée sur l'algorithme de compression par codage par paires d'octets (BPE), et montrons empiriquement que les modèles sous-mot améliorent la performance par rapport à une base de référence utilisant un dictionnaire de repli pour les tâches de traduction WMT 15 anglais-allemand et anglais-russe, respectivement, de 1,1 et 1,3 points BLEU.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Traduction neuronale de mots rares avec des unités sous-motiales | Articles | HyperAI