Zu neuralem phrasenbasierten maschinellen Übersetzen

In dieser Arbeit stellen wir die neurale phrasenbasierte Maschinelle Übersetzung (NPMT) vor. Unsere Methode modelliert die Phrasenstrukturen in den Ausgabesequenzen explizit mit Hilfe von Sleep-Wake Netzen (SWAN), einer kürzlich vorgeschlagenen segmentierungsbasierten Sequenzmodellierungsmethode. Um das monotonische Anordnungsprinzip von SWAN zu mildern, führen wir eine neue Schicht ein, die eine (weiche) lokale Neuordnung der Eingabesequenzen durchführt. Im Gegensatz zu bestehenden Ansätzen der neuronalen Maschinellen Übersetzung (NMT) verwendet NPMT keine aufmerksamkeitsbasierten Decodiermechanismen. Stattdessen gibt es Phrasen direkt in sequentieller Reihenfolge aus und kann in linearer Zeit decodieren. Unsere Experimente zeigen, dass NPMT bei den Maschinellen Übersetzungs-Aufgaben IWSLT 2014 Deutsch-Englisch/Englisch-Deutsch und IWSLT 2015 Englisch-Vietnamesisch bessere Leistungen erzielt als starke NMT-Baselines. Wir beobachten auch, dass unsere Methode sinnvolle Phrasen in den Ausgabe-Sprachen erzeugt.