摘要
本文提出了一种基于循环神经网络(Recurrent Neural Network, RNN)的胶囊网络模型——RNN-Capsule,用于情感分析任务。针对某一具体问题,模型为每个情感类别(如“积极”和“消极”)构建一个对应的胶囊。每个胶囊包含一个属性、一个状态以及三个核心模块:表示模块、概率模块和重构模块。胶囊的属性即为其所对应的情感类别。给定一个由标准RNN编码为隐藏向量的输入实例,表示模块通过注意力机制构建该胶囊的特征表示。基于此表示,概率模块计算该胶囊的状态概率;当某一胶囊的状态概率在所有胶囊中最大时,该胶囊处于激活状态,否则为非激活状态。在两个公开基准数据集(电影评论数据集和斯坦福情感树库)以及一个私有数据集(医院反馈数据集)上的实验结果表明,RNN-Capsule在情感分类任务中达到了当前最优的性能表现。更重要的是,该模型在不依赖任何语言学先验知识的前提下,能够自动识别并输出具有情感倾向性的关键词,这些关键词能够有效反映胶囊的属性特征,且充分体现了数据集所具有的领域特异性。