11 天前
S+PAGE:一种面向对话情感识别的说话人与位置感知图神经网络模型
Chen Liang, Chong Yang, Jing Xu, Juyang Huang, Yongliang Wang, Yang Dong

摘要
近年来,对话中的情感识别(Emotion Recognition in Conversation, ERC)因其在广泛应用场景中的重要性而受到广泛关注。现有ERC方法大多分别建模说话人自身上下文与跨说话人上下文,导致二者之间交互不足,成为制约性能提升的关键问题。为此,本文提出一种新型的说话人与位置感知图神经网络模型——S+PAGE(Speaker and Position-Aware Graph neural network for ERC),该模型包含三个阶段,旨在融合Transformer与关系图卷积网络(Relational Graph Convolution Network, R-GCN)的优势,实现更优的上下文建模。首先,设计了一种双流对话Transformer,用于提取每个话语的粗粒度自身上下文与跨说话人上下文特征。其次,构建了一个融合说话人身份与位置信息的对话图结构,并提出一种增强型R-GCN模型——PAG(Position-Aware Graph convolution),通过相对位置编码对粗粒度特征进行精细化调整。最后,将前两个阶段提取的特征输入条件随机场(Conditional Random Field, CRF)层,以建模情感在对话中的传递过程。