11 天前
对话行为分类中的说话人切换感知CRF
Guokan Shang, Antoine Jean-Pierre Tixier, Michalis Vazirgiannis, Jean-Pierre Lorré

摘要
近年来,对话行为(Dialogue Act, DA)分类研究将该任务视为序列标注问题,通常采用神经网络模型,并在其末端叠加条件随机场(CRF)层以建模给定输入话语序列下目标DA标签序列的条件概率。然而,该任务还涉及另一个关键输入序列——说话人序列,而此前的研究普遍忽略了这一因素。为解决这一局限,本文提出对CRF层进行简单但有效的改进,使其能够显式考虑说话人转换的影响。在SwDA语料库上的实验结果表明,改进后的CRF层在多数DA标签上显著优于原始CRF模型,部分标签的性能提升尤为显著。此外,可视化分析进一步表明,所提出的CRF层能够以端到端的方式学习到与说话人转换相关的、具有语义意义且复杂的DA标签对之间的转移模式。相关代码已公开发布。