2 个月前

使用层次编码器和CRF进行对话行为序列标注

Harshit Kumar; Arvind Agarwal; Riddhiman Dasgupta; Sachindra Joshi; Arun Kumar
使用层次编码器和CRF进行对话行为序列标注
摘要

对话行为识别(Dialogue Act Recognition)将对话中的每个话语与其对应的对话行为(即语义标签)关联起来。将语义标签与话语关联的问题可以视为一个序列标注问题。在本研究中,我们构建了一个层次递归神经网络,以双向长短期记忆网络(Bidirectional LSTM)作为基础单元,条件随机场(Conditional Random Field, CRF)作为顶层来对每个话语进行分类,确定其相应的对话行为。该层次网络在多个层级上学习表示,包括词汇级、话语级和对话级。对话级别的表示被输入到CRF层,该层不仅考虑了所有先前的话语,还考虑了它们的对话行为,从而建模了标签和话语之间的依赖关系,这是自然对话中的一个重要考量因素。我们在两个不同的基准数据集上验证了我们的方法:Switchboard 和会议记录对话行为数据集(Meeting Recorder Dialogue Act),并分别在这些数据集上比现有最先进方法绝对提高了2.2%和4.1%的性能。值得注意的是,Switchboard 数据集的注释者间一致性为84%,而我们的方法尽管是在噪声数据上训练的,仍能达到约79%的准确率。

使用层次编码器和CRF进行对话行为序列标注 | 最新论文 | HyperAI超神经