2 个月前
LaERC-S:基于LLM的对话情感识别中融入说话人特征以提升性能
Yumeng Fu; Junjie Wu; Zhongjie Wang; Meishan Zhang; Lili Shan; Yulin Wu; Bingquan Li

摘要
情感识别在对话(ERC)中是指在对话中的每个话语中辨别出人类的情感,这一任务在人机交互系统中受到了广泛关注。以往的ERC研究主要集中在说话者特定的信息上,这些信息大多来源于话语之间的关系,但缺乏足够的对话背景信息。近期的ERC研究试图利用预训练的大规模语言模型(LLMs)结合说话者建模来理解情感状态。尽管这些方法取得了令人鼓舞的结果,但提取的说话者特定信息仍难以反映情感动态。本文受说话者特征在情感识别中起关键作用以及大规模语言模型拥有丰富世界知识这一事实的启发,提出了一种名为LaERC-S的新框架,该框架旨在激发大规模语言模型探索涉及对话参与者心理状态和行为的说话者特征,以实现准确的情感预测。为了赋予大规模语言模型这种知识信息,我们采用了两阶段学习方法,使模型能够在复杂的对话场景中推理说话者的特征并跟踪其情感变化。在三个基准数据集上的大量实验表明了LaERC-S的优势,达到了新的最先进水平。