HyperAIHyperAI

Command Palette

Search for a command to run...

Intégration d’un Modèle Linguistique Pré-entraîné dans la Traduction Automatique Neurale

Soon-Jae Hwang Chang-Sung Jeong

Résumé

La traduction automatique neurale (NMT) est devenue une technologie majeure dans le domaine du traitement du langage naturel grâce à des recherches et développements intensifs. Toutefois, le manque de données de paires de langues bilingues de haute qualité constitue encore un défi majeur pour améliorer les performances de la NMT. Des études récentes ont exploré l’utilisation d’informations contextuelles provenant de modèles de langage pré-entraînés (PLM) afin de relever ce défi. Néanmoins, le problème d’incompatibilité entre les modèles PLM et NMT reste non résolu. Cette étude propose un modèle de NMT intégrant un PLM, appelé PiNMT, afin de surmonter ces limitations. Le modèle PiNMT se compose de trois composants essentiels : le convertisseur à plusieurs couches PLM, la fusion d’embeddings et l’alignement cosinus, chacun jouant un rôle fondamental dans l’apport efficace d’informations provenant du PLM au modèle NMT. En outre, deux stratégies d’entraînement sont introduites dans cet article : l’apprentissage avec taux d’apprentissage séparés et l’entraînement en deux étapes. En mettant en œuvre le modèle PiNMT proposé ainsi que la stratégie d’entraînement associée, nous obtenons des performances de pointe sur le jeu de données IWSLT’14 En↔De. Les résultats de cette étude sont remarquables, car ils démontrent une nouvelle approche efficace pour intégrer un PLM dans un cadre de NMT, surmonter les incompatibilités et améliorer significativement les performances.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp