7 天前

阿里巴巴在IJCNLP-2017任务1:将语法特征嵌入LSTM用于中文语法错误诊断任务

{Linlin Li, Pengjun Xie, Yi Yang, Luo Si, Jun Tao, Guangwei Xu}
阿里巴巴在IJCNLP-2017任务1:将语法特征嵌入LSTM用于中文语法错误诊断任务
摘要

本文介绍了阿里巴巴自然语言处理团队在IJCNLP 2017共享任务第1项——中文语法错误诊断(Chinese Grammatical Error Diagnosis, CGED)中的参赛系统。该任务旨在识别四类语法错误:冗余词(R)、缺失词(M)、用词不当(S)以及词序错误(W)。我们将该任务建模为序列标注问题,并设计了多种人工特征以提升性能。系统主要基于LSTM-CRF模型,并采用了三种集成策略来进一步优化结果。在错误识别与错误定位两个层面,我们的系统均取得了最高的F1分数。尤其在最具挑战性的定位层面,我们在所有评价指标上均表现最优。

阿里巴巴在IJCNLP-2017任务1:将语法特征嵌入LSTM用于中文语法错误诊断任务 | 最新论文 | HyperAI超神经