
摘要
神经序列模型在句子级情感分类中取得了显著的成功。然而,一些模型异常复杂或依赖昂贵的特征。另一些模型虽然认识到现有语言资源的价值,但利用得不够充分。本文提出了一种新颖且通用的方法,将词典信息(包括正负情感词汇、否定词和程度副词)融入模型中。词语被标注为细粒度和粗粒度标签。所提出的方法首先将细粒度标签编码为情感嵌入,并将其与词嵌入拼接在一起。其次,利用粗粒度标签增强注意力机制,以赋予情感相关词语更大的权重。实验结果表明,我们的方法可以提高神经序列模型在SST-5和MR数据集上的分类准确性。具体而言,增强的双向长短期记忆网络(Bi-LSTM)模型甚至可以与使用昂贵短语级注释的树形长短期记忆网络(Tree-LSTM)相媲美。进一步分析显示,在大多数情况下,词典资源可以提供正确的注释。此外,所提出的方法还能够克服不可避免的错误注释的影响。