
摘要
在自动作文评分(Automatic Essay Grading, AEG)领域,大多数研究集中于对作文进行整体评分,同时也有一些工作致力于对作文的各个具体特征进行评分。本文提出一种基于多任务学习(Multi-Task Learning, MTL)的作文整体评分方法,其中整体评分作为主任务,而作文特征评分则作为辅助任务。我们采用LSTM与双向LSTM(BiLSTM)模型,将该方法与单任务学习(Single-Task Learning, STL)方法进行对比。此外,我们还将辅助任务的评分结果与其他AEG系统中的类似任务进行比较。为探究不同作文类型下各作文特征的贡献效果,我们对每一项作文特征进行了消融实验(ablation tests)。同时,本文还报告了各系统在运行时间与训练参数数量方面的性能指标。实验结果表明,基于MTL的BiLSTM模型在整体作文评分任务上表现最优,同时在作文特征评分任务上也取得了良好效果。