Verbesserung der Maschinellen Leseverständnis-Aufgaben durch ein Wahlentscheidungsverfahren mit einzelnen Auswahlmöglichkeiten und Transfer-Lernen

Die mehrfachwahlbasierte Maschinenleseverständnis-Aufgabe (Multi-choice Machine Reading Comprehension, MMRC) zielt darauf ab, die korrekte Antwort aus einer gegebenen Menge von Antwortmöglichkeiten basierend auf einem vorgegebenen Textabschnitt und einer Frage auszuwählen. Aufgrund der spezifischen Anforderungen der MMRC ist es nicht trivial, Wissen aus anderen MRC-Aufgaben wie SQuAD oder Dream zu übertragen. In diesem Artikel rekonstruieren wir die mehrfachwahlbasierte Aufgabe einfach in eine eindeutig auswählbare Form, indem wir ein binäres Klassifikationsmodell trainieren, um zu erkennen, ob eine bestimmte Antwort korrekt ist. Anschließend wählen wir die Antwort mit der höchsten Vertrauenswertigkeit aus. Wir basieren unser Modell auf dem ALBERT-xxlarge-Modell und evaluieren es anhand des RACE-Datensatzes. Während des Trainings setzen wir eine AutoML-Strategie ein, um optimale Parameter zu finden. Experimentelle Ergebnisse zeigen, dass die eindeutig auswählbare Form die mehrfachwahlbasierte Form übertrifft. Zudem erreicht unser Modell durch die Übertragung von Wissen aus anderen Arten von MRC-Aufgaben neue SOTA-Ergebnisse (state-of-the-art) sowohl im einzelnen als auch im Ensemble-Setting.