
摘要
对话具有固有的多对一属性,这意味着在相同的对话上下文中可以有多个合适的回应。在任务导向型对话中,这一属性导致了完成任务时存在不同的有效对话策略。然而,现有的所有任务导向型对话生成方法都未考虑这一属性。我们提出了一种多动作数据增强(MADA)框架,利用多对一属性生成多样化的合适对话回应。具体而言,我们首先使用对话状态来总结对话历史,然后发现从每个对话状态到其不同有效系统动作的所有可能映射。在对话系统训练过程中,我们将当前的对话状态映射到前一过程中发现的所有有效系统动作,以创建额外的状态-动作对。通过整合这些额外的对,对话策略学习到了一个平衡的动作分布,这进一步指导了对话模型生成多样化的回应。实验结果表明,所提出的框架能够持续提高对话策略的多样性,并且提升了回应的多样性和适宜性。我们的模型在MultiWOZ上取得了最先进的结果。