HyperAIHyperAI
il y a 2 mois

Soumission de la tâche de traduction de nouvelles WMT19 par Facebook FAIR

Nathan Ng; Kyra Yee; Alexei Baevski; Myle Ott; Michael Auli; Sergey Edunov
Soumission de la tâche de traduction de nouvelles WMT19 par Facebook FAIR
Résumé

Ce document décrit la soumission de Facebook FAIR à la tâche partagée de traduction de nouvelles du WMT19. Nous participons à deux paires linguistiques et quatre directions de traduction, à savoir l'anglais <-> allemand et l'anglais <-> russe. Suite à notre soumission de l'année dernière, nos systèmes de base sont des modèles transformateurs volumineux basés sur BPE (Byte Pair Encoding) formés avec le Fairseq, un outil de modélisation séquentielle, qui s'appuient sur des back-translations échantillonnées. Cette année, nous expérimentons différentes méthodes de filtrage des données bilingues, ainsi que l'ajout de données back-translatées filtrées. Nous combinons également nos modèles et les affinons sur des données spécifiques au domaine, puis décodons en utilisant le réordonnancement par modèle de canal bruyant. Nos soumissions ont été classées premières dans les quatre directions lors de la campagne d'évaluation humaine. Sur la direction En->De (anglais vers allemand), notre système surpass significativement les autres systèmes ainsi que les traductions humaines. Ce système améliore notre soumission WMT'18 de 4,5 points BLEU.