
摘要
神经序列到序列(seq2seq)方法在语法错误修正(GEC)方面已被证明是成功的。基于seq2seq框架,我们提出了一种新颖的流畅度增强学习和推理机制。流畅度增强学习在训练过程中生成多样化的错误修正句对,使错误修正模型能够从更多实例中学习如何提高句子的流畅度;而流畅度增强推理则允许模型通过多个推理步骤逐步修正句子。我们将流畅度增强学习和推理机制与卷积序列到序列模型相结合,所提出的方法在CoNLL-2014 10注释数据集上达到了75.72(F_{0.5})的性能,在JFLEG测试集上达到了62.42(GLEU)的性能,分别成为首个在这两个基准测试中达到人类水平表现(CoNLL为72.58,JFLEG为62.37)的GEC系统。