
摘要
面向任务的对话系统中的经典流水线模型需要显式建模对话状态和手工设计的动作空间,以查询特定领域的知识库。相比之下,序列到序列模型则无需显式查询知识库,而是学习将对话历史映射到当前轮次的响应。在本研究中,我们提出了一种新颖的框架,该框架结合了经典流水线模型和序列到序列模型的优势。我们的框架将对话状态建模为固定大小的分布式表示,并通过注意力机制利用这种表示来查询知识库。在斯坦福多轮多领域面向任务的对话数据集上的实验表明,我们的框架在自动评估和人工评估方面均显著优于其他基于序列到序列的基线模型。
面向任务的对话系统中的经典流水线模型需要显式建模对话状态和手工设计的动作空间,以查询特定领域的知识库。相比之下,序列到序列模型则无需显式查询知识库,而是学习将对话历史映射到当前轮次的响应。在本研究中,我们提出了一种新颖的框架,该框架结合了经典流水线模型和序列到序列模型的优势。我们的框架将对话状态建模为固定大小的分布式表示,并通过注意力机制利用这种表示来查询知识库。在斯坦福多轮多领域面向任务的对话数据集上的实验表明,我们的框架在自动评估和人工评估方面均显著优于其他基于序列到序列的基线模型。