vor 17 Tagen
Bessere Übersetzung für Vietnamesisch
{Trieu Trinh, Chinh Ngo}
Abstract
Wir sammeln Daten aus offenen Quellen im Internet und klassifizieren sie in verschiedene Kategorien, jeweils mit einem spezifischen Sprachstil versehen. Insgesamt verfügen wir über 3,3 Millionen Textpaare aus Englisch und Vietnamesisch, die von einzelnen Sätzen bis hin zu Absätzen reichen. Ein Modell, das mit unserem Datensatz trainiert wurde, erreicht auf einer ausgewählten Gruppe vielfältiger Textquellen eine bessere Leistung als Google Translate. Auf dem IWSLT'15-Datensatz erzielten wir eine BLEU-Score von 37,84.