
摘要
在产品评论中,诸如用户和产品信息之类的文本属性已被用于提高情感分类模型的性能。目前的标准方法是在注意力机制中将这些属性作为额外的偏置项进行融合,而通过扩展模型架构可以进一步提升性能。本文表明,上述方法是表示和注入属性的最无效的方式之一。为了验证这一假设,与以往具有复杂架构的模型不同,我们将基础模型限制为一个简单的双向长短期记忆网络(BiLSTM)加注意力分类器,并重点研究如何以及在模型的哪些部分注入属性。我们提出将属性表示为分块的重要性权重矩阵,并考虑了四个可能的位置(即嵌入层、编码层、注意力层和分类器层)来注入这些属性。实验结果表明,我们的方法相比标准方法取得了显著的改进,并且注意力机制是最不适合注入属性的位置,这与先前的研究结论相悖。尽管我们使用的是一个简单的基础模型,但我们的表现仍然优于当前最先进的方法。最后,我们还证明了这些表示在其他任务中也能很好地迁移。模型实现和数据集已发布在以下链接:https://github.com/rktamplayo/CHIM。