2 个月前

基于深度对齐聚类发现新意图

Hanlei Zhang; Hua Xu; Ting-En Lin; Rui Lyu
基于深度对齐聚类发现新意图
摘要

发现新意图是对话系统中的一个重要任务。现有的大多数方法在将已知意图的先验知识迁移到新意图上时存在局限性,同时在为学习有利于聚类的特征提供高质量监督信号方面也面临困难。本文提出了一种有效的方法——深度对齐聚类(Deep Aligned Clustering),利用有限的已知意图数据来发现新意图。首先,我们利用少量已标记的已知意图样本作为先验知识对模型进行预训练。然后,通过k均值算法生成聚类分配作为伪标签。此外,我们提出了一种对齐策略,以解决聚类分配过程中的标签不一致问题。最后,在对齐后的伪标签监督下学习意图表示。对于未知数量的新意图,我们通过消除低置信度的意图类别簇来预测意图类别的数量。我们在两个基准数据集上进行了广泛的实验,结果表明我们的方法更加稳健,并且相比现有最先进方法取得了显著改进。代码已发布在 https://github.com/thuiar/DeepAligned-Clustering。