Multi-Agent Dual Learning

Dual Learning hat in den Gemeinschaften des maschinellen Lernens, der Computer Vision und der natürlichen Sprachverarbeitung erhebliche Aufmerksamkeit erregt. Der zentrale Gedanke des Dual Learning besteht darin, die Dualität zwischen der primären Aufgabe (Abbildung von Domäne X auf Domäne Y) und der dualen Aufgabe (Abbildung von Domäne Y auf X) zu nutzen, um die Leistung beider Aufgaben zu verbessern. Bestehende Dual-Learning-Frameworks bilden ein System aus zwei Agenten (einem primären Modell und einem dualen Modell), um diese Dualität auszunutzen. In diesem Artikel erweitern wir dieses Framework durch die Einführung mehrerer primärer und dualer Modelle und stellen ein Multi-Agenten-Dual-Learning-Framework vor. Experimente auf Aufgaben des neuronalen Maschinellen Übersetzens und der Bildübersetzung belegen die Wirksamkeit des neuen Ansatzes. Insbesondere erreichen wir mit einem BLEU-Score von 35,44 einen neuen Rekord auf dem IWSLT 2014-Datensatz für die Übersetzung von Deutsch nach Englisch, erzielen auf dem WMT 2014-Datensatz für die Übersetzung von Englisch nach Deutsch einen BLEU-Score von 31,03 – eine Verbesserung um über 2,6 Punkte gegenüber dem starken Transformer-Baseline – und setzen zudem einen neuen Rekord mit einem BLEU-Score von 49,61 auf dem aktuellen WMT 2018-Datensatz für die Übersetzung von Englisch nach Deutsch.