End-to-End Offline-Sprachübersetzungssystem für IWSLT 2020 unter Verwendung von modality-agnostischem Meta-Lernen

In diesem Paper beschreiben wir das System, das für die IWSLT 2020 Offline Speech Translation Aufgabe eingereicht wurde. Wir verwenden die Transformer-Architektur in Kombination mit einem Meta-Learning-Ansatz, um ein end-to-end Sprache-zu-Text-Übersetzungs-(ST-)System zu entwickeln. Der Meta-Learning-Ansatz adressiert die Datenknappheit bei der ST-Aufgabe, indem er die verfügbaren Daten aus den Aufgaben des automatischen Spracherkennungs (ASR) und der maschinellen Übersetzung (MT) nutzt. Durch die Kombination des Meta-Learning-Ansatzes mit Techniken zur synthetischen Datenverstärkung (data augmentation) wird die Modellleistung erheblich verbessert und es werden BLEU-Scores von 24,58, 27,51 und 27,61 auf den Testsets IWSLT Test 2015, MuST-C Test und Europarl-ST erreicht.