
摘要
在本研究中,我们提出了一种基于字符串核函数和词嵌入相结合的方法,用于自动作文评分。字符串核函数通过统计共同的字符n-gram来捕捉字符串之间的相似性,这是一种低层次但功能强大的特征类型,在各种文本分类任务中表现出色,例如阿拉伯方言识别或母语识别。据我们所知,这是首次将字符串核函数应用于自动作文评分。我们也是首次将它们与高层次的语义特征表示——即超级词嵌入包(bag-of-super-word-embeddings)相结合。我们在Automated Student Assessment Prize数据集上报告了最佳性能,无论是在域内还是跨域设置下,均超过了最近的最先进的深度学习方法。