il y a 6 mois

Résumé

Nous introduisons la diversification des données : une stratégie simple mais efficace pour améliorer les performances de la traduction automatique par réseaux neuronaux (NMT). Cette méthode diversifie les données d'entraînement en exploitant les prédictions de plusieurs modèles directs et inverses, puis en combinant ces données avec le jeu de données original utilisé pour entraîner le modèle NMT final. Notre approche est applicable à tous les modèles NMT, sans nécessiter de données monolingues supplémentaires comme dans la back-translation, ni ajouter de calculs ou de paramètres supplémentaires, contrairement aux ensembles de modèles. Elle atteint des scores BLEU de pointe, respectivement de 30,7 et 43,7, sur les tâches de traduction anglais-allemand et anglais-français du WMT'14. Elle améliore également de manière significative huit autres tâches de traduction : quatre tâches IWSLT (anglais-allemand et anglais-français) et quatre tâches à faibles ressources (anglais-népalais et anglais-sinhala). Nous démontrons que notre méthode est plus efficace que la distillation de connaissances et l'apprentissage dual, qu'elle présente une forte corrélation avec les ensembles de modèles, et qu'elle permet de réduire la perplexité au profit d'un meilleur score BLEU. Nous avons mis à disposition notre code source à l'adresse suivante : https://github.com/nxphi47/data_diversification

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 6 mois

Traduction

Apprentissage Profond

Transformer

Domaine De Recherche

Approche/Framework

Traitement Du Langage Naturel

Tâche

Xuan-Phi Nguyen Shafiq Joty Wu Kui Ai Ti Aw

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 6 mois

Traduction

Apprentissage Profond

Transformer

Domaine De Recherche

Approche/Framework

Traitement Du Langage Naturel

Tâche

Xuan-Phi Nguyen Shafiq Joty Wu Kui Ai Ti Aw

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Diversification des données : une stratégie simple pour la traduction automatique neurale | Articles | HyperAI

Command Palette

Diversification des données : une stratégie simple pour la traduction automatique neurale

Xuan-Phi Nguyen Shafiq Joty Wu Kui Ai Ti Aw

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Diversification des données : une stratégie simple pour la traduction automatique neurale

Xuan-Phi Nguyen Shafiq Joty Wu Kui Ai Ti Aw

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Diversification des données : une stratégie simple pour la traduction automatique neurale

Xuan-Phi Nguyen Shafiq Joty Wu Kui Ai Ti Aw

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters