Frustrierend einfache Systemkombination für die grammatische Fehlerkorrektur

In diesem Paper formulieren wir die Systemkombination für grammatische Fehlerkorrektur (GEC) als eine einfache maschinelle Lernaufgabe: binäre Klassifikation. Wir zeigen, dass mit der richtigen Problemformulierung ein einfacher Logistik-Regression-Algorithmus äußerst effektiv zur Kombination von GEC-Modellen eingesetzt werden kann. Unsere Methode steigert die F0.5-Score des besten Basis-GEC-Systems um 4,2 Punkte auf dem CoNLL-2014-Testset und um 7,2 Punkte auf dem BEA-2019-Testset. Zudem übertrifft unsere Methode die State-of-the-Art-Methoden um 4,0 Punkte auf dem BEA-2019-Testset, um 1,2 Punkte auf dem CoNLL-2014-Testset mit originaler Annotation und um 3,4 Punkte auf dem CoNLL-2014-Testset mit alternativer Annotation. Zudem zeigen wir, dass unsere Systemkombination im Vergleich zu herkömmlichen Ensembles bessere Korrekturen mit höheren F0.5-Scores erzeugt.