2 个月前
学习结合语法错误修正
Yoav Kantor; Yoav Katz; Leshem Choshen; Edo Cohen-Karlik; Naftali Liberman; Assaf Toledo; Amir Menczel; Noam Slonim

摘要
语法错误校正(Grammatical Error Correction, GEC)领域已经开发了多种系统来处理特定现象或进行一般文本编辑。我们提出了一种自动结合黑盒系统的方案。该方法能够自动检测每种错误类型下单一系统或多个系统的强度,从而在直接优化 $F$ 值的同时提高精确度和召回率。我们在所有测试配置中均显示出比最佳独立系统更为一致的改进效果。此外,我们的方法还优于不同随机初始化的循环神经网络(RNN)模型的平均集成。此外,我们分析了 BERT 在 GEC 中的应用,并报告了有前景的结果。我们还为这一任务开发了一种拼写检查器,其性能超过了在拼写检查任务中测试的标准拼写检查器。本文描述了一个提交至 2019 年构建教育应用共享任务:语法错误校正的系统。利用我们的方法结合 2019 年 BEA 共享任务中的顶级系统输出,在开放阶段目前取得了最高的报告分数,相比最佳结果提高了 3.7 个 F0.5 分值。