
摘要
情感识别(Emotion Recognition, ER)是自然语言处理(Natural Language Processing, NLP)中的一个重要任务,因其在健康与福祉、作者画像、消费者分析以及安全等多个现实应用场景中具有广泛影响而备受关注。当前的ER方法主要采用独立分类的方式对情绪进行判断,未能充分考虑情绪之间可能共存的特性,因而容易忽略多种情绪重叠所带来的潜在歧义。为此,本文提出一种新模型——SpanEmo,将多标签情感分类问题建模为跨度预测(span-prediction)任务,从而帮助ER模型学习情感标签与句子中词语之间的关联关系。此外,我们设计了一种专注于建模输入句子中多种共存情绪的损失函数。在SemEval2018多标签情感数据集上,针对英语、阿拉伯语和西班牙语三种语言的实验结果验证了所提方法的有效性。最后,本文通过多种分析进一步揭示了该方法在提升模型性能以及学习情感类别与句子词语之间语义关联方面的显著优势。