
摘要
先前的研究将情感分析视为一种文档分类任务,即把输入文档归类到预定义的情感类别中。尽管文档中的某些句子为情感分析提供了重要依据,而另一些句子则无关紧要,但以往方法通常将文档视为一个“句子的集合”(bag of sentences),未考虑文档中各句子的重要性差异。为准确判断文档的整体情感极性,文档中的每一句子应根据其重要程度被赋予不同的权重。为解决这一问题,本文提出一种基于深度神经网络的文档级句子分类模型,通过门控机制(gate mechanisms)自动学习并确定文档中各句子的重要性程度。为验证所提模型的有效性,我们在四个不同领域(电影评论、酒店评论、餐厅评论和音乐评论)的情感数据集上进行了实验。实验结果表明,与以往不考虑句子重要性差异的最先进模型相比,本文提出的模型在性能上具有显著优势。实验结果充分说明,在进行文档级情感分类任务时,必须充分考虑句子的重要性。