Unüberwachte neuronale Maschinenübersetzung mit Gewichtsannahme

Die unüberwachte neuronale Maschinelle Übersetzung (NMT) ist ein kürzlich vorgeschlagener Ansatz für die Maschinelle Übersetzung, der das Ziel verfolgt, das Modell ohne Verwendung von etikettierten Daten zu trainieren. Die für die unüberwachte NMT vorgeschlagenen Modelle verwenden oft nur einen gemeinsamen Encoder, um Satzpaare aus verschiedenen Sprachen in einen gemeinsamen latenten Raum abzubilden. Dieser Ansatz ist jedoch schwach darin, die einzigartigen und internen Eigenschaften jeder Sprache wie Stil, Terminologie und Satzstruktur beizubehalten. Um dieses Problem zu lösen, führen wir eine Erweiterung ein, bei der zwei unabhängige Encoders verwendet werden, aber teilweise Gewichte geteilt werden, die für die Extraktion hochstufiger Repräsentationen der Eingabesätze verantwortlich sind. Darüber hinaus schlagen wir zwei verschiedene Generative Adversarial Networks (GANs) vor: den lokalen GAN und den globalen GAN, um die übersprachliche Übersetzung zu verbessern. Mit diesem neuen Ansatz erzielen wir erhebliche Verbesserungen bei den ÜbersetzungsAufgaben Englisch-Deutsch, Englisch-Französisch und Chinesisch-Englisch.