HyperAIHyperAI
vor 15 Tagen

Das erste neuronale Maschinenübersetzungssystem für die Sprache der Erzya

David Dale
Das erste neuronale Maschinenübersetzungssystem für die Sprache der Erzya
Abstract

Wir präsentieren das erste neuronale Maschinenübersetzungssystem für die Übersetzung zwischen der bedrohten Sprache Erzya und Russisch sowie den von uns gesammelten Datensatz, der zur Trainierung und Bewertung des Systems verwendet wurde. Die BLEU-Scores betragen 17 bei der Übersetzung ins Erzya und 19 bei der Übersetzung ins Russische, wobei mehr als die Hälfte der Übersetzungen von Muttersprachlern als akzeptabel bewertet wurden. Zudem adaptieren wir unser Modell für die Übersetzung zwischen Erzya und zehn weiteren Sprachen; ohne zusätzliche parallele Daten bleibt jedoch die Qualität in diesen Richtungen gering. Wir stellen die Übersetzungsmodelle zusammen mit dem gesammelten Textkorpus, einem neuen Spracherkennungsmodell und einem mehrsprachigen Satz-Encoder, der für die Erzya-Sprache angepasst wurde, öffentlich zur Verfügung. Diese Ressourcen sind unter https://github.com/slone-nlp/myv-nmt verfügbar.