HyperAIHyperAI

Command Palette

Search for a command to run...

Satzbausbasierte und neuronale unsupervisierte Maschinelle Übersetzung

Raffel, Colin Shazeer, Noam Zhang, Ying Le, Quoc Mitchell, Tomas

Zusammenfassung

Maschinelle Übersetzungssysteme erreichen bei einigen Sprachen nahezu menschliches Leistungsniveau, ihre Effektivität hängt jedoch stark von der Verfügbarkeit großer Mengen an parallelen Sätzen ab, was ihre Anwendbarkeit auf die Mehrheit der Sprachpaare behindert. Diese Arbeit untersucht, wie man übersetzen kann, wenn man nur über große monolinguale Korpora in jeder Sprache verfügt. Wir schlagen zwei Modellvarianten vor: ein neuronales und ein phrasenbasiertes Modell. Beide Versionen nutzen eine sorgfältige Initialisierung der Parameter, den Rauschunterdrückungseffekt von Sprachmodellen und die automatische Generierung paralleler Daten durch iterative Rückübersetzung (back-translation). Diese Modelle sind erheblich besser als Methoden aus der Literatur, sind dabei einfacher und haben weniger Hyperparameter. Bei den weit verbreiteten Benchmarks WMT'14 Englisch-Französisch und WMT'16 Deutsch-Englisch erzielen unsere Modelle jeweils 28,1 und 25,2 BLEU-Punkte ohne die Verwendung eines einzigen parallelen Satzes, wodurch sie den Stand der Technik um mehr als 11 BLEU-Punkte übertrumpfen. Bei sprachlichen Ressourcen mit geringer Verfügbarkeit wie Englisch-Urdu und Englisch-Rumänisch erreichen unsere Methoden sogar bessere Ergebnisse als halbüberwachte und überwachte Ansätze, die sich auf die wenigen verfügbaren Paralleltexte stützen. Unser Code für NMT (Neurale maschinelle Übersetzung) und PBSMT (Phrasenbasierte statistische maschinelle Übersetzung) ist öffentlich zugänglich.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp