
要約
本稿では、文法的誤り訂正(GEC)におけるシステム結合を単純な機械学習タスク、すなわち二値分類として定式化する。適切な問題定式化のもとで、シンプルなロジスティック回帰アルゴリズムがGECモデルの結合に非常に有効であることを示す。本手法は、CoNLL-2014テストセットにおいて最高性能を示すベースGECシステムに対し、F0.5スコアを4.2ポイント向上させ、BEA-2019テストセットでは7.2ポイント向上させた。さらに、BEA-2019テストセットでは最先端手法を4.0ポイント上回り、CoNLL-2014テストセット(元のアノテーション)では1.2ポイント、代替アノテーションを用いたCoNLL-2014テストセットでは3.4ポイントの性能向上を達成した。また、従来のアンサンブル手法と比較して、本システム結合はより優れた訂正結果を生成し、F0.5スコアにおいても高い性能を発揮することを示した。