HyperAIHyperAI
vor einem Monat

Das Maschinelle Übersetzungssystem der University of Sydney für WMT19

Liang Ding; Dacheng Tao
Das Maschinelle Übersetzungssystem der University of Sydney für WMT19
Abstract

Dieses Papier beschreibt die Einreichung der Universität Sydney für die gemeinsame News-Übersetzungsaufgabe des WMT 2019. Wir nahmen an der Übersetzungsrichtung Finnisch → Englisch teil und erzielten den besten BLEU-Wert (33,0) unter allen Teilnehmern. Unser System basiert auf selbst-attentiven Transformer-Netzwerken, in die wir die neuesten effektiven Strategien aus akademischer Forschung integrierten (z.B. BPE, Rückübersetzung, mehrfachige Merkmalsauswahl, Datenaugmentierung, gierige Modellkombination, Reranking, ConMBR-Systemkombination und Nachbearbeitung). Darüber hinaus schlagen wir eine neue Augmentationsmethode „Zyklische Übersetzung“ ($Cycle Translation$) sowie eine Mischstrategie für Daten „Groß“/„Klein“ parallele Konstruktion vor, um den synthetischen Korpus vollständig zu nutzen. Ausführliche Experimente zeigen, dass die Hinzufügung der oben genannten Techniken kontinuierliche Verbesserungen der BLEU-Werte ermöglicht. Das beste Ergebnis übertreffen den Baseline (ein Ensemble von Transformer-Modellen, trainiert mit dem ursprünglichen parallelen Korpus) um etwa 5,3 BLEU-Punkte und erreicht den Stand der Technik.

Das Maschinelle Übersetzungssystem der University of Sydney für WMT19 | Neueste Forschungsarbeiten | HyperAI