Verbesserte grammatische Fehlerkorrektur durch Rangfolge elementarer Bearbeitungen

Wir präsentieren eine Nachbewertungsmethode für die Grammatikfehlerkorrektur, die auf einem zweistufigen Verfahren basiert: Das Modell der ersten Stufe extrahiert lokale Korrekturen, und das Modell der zweiten Stufe klassifiziert diese als korrekt oder falsch. Wir zeigen, wie ein Encoder-Decoder-Ansatz oder ein Verfahren zur Sequenzmarkierung als erste Stufe unseres Modells eingesetzt werden kann. Unsere Methode erreicht sogar mit einem schwachen Basismodell (BERT-GEC) Spitzenleistung auf dem BEA 2019-Datensatz für Englisch. Bei Verwendung eines modernsten Edit-Generators (GECToR) und des kombinierten Scoring-Modells übertrifft unser Ansatz GECToR auf BEA 2019 um 2–3 %. Zudem erreicht unser Modell auch auf russischen Datensätzen die bisher beste Leistung, obwohl wir kleinere Modelle und weniger Trainingsdaten im Vergleich zu früheren Ansätzen verwenden.