12 天前

基于对抗训练的双教师知识融合任务导向对话系统

{Ruifeng Xu, Ying Shen, Chengming Li, Rui Yan, Min Yang, Wanwei He}
基于对抗训练的双教师知识融合任务导向对话系统
摘要

如何在任务导向型对话系统中同时实现知识库实体的准确检索与生成类人化回复,已成为当前研究的热点挑战。本文提出一种名为“双教师一学生”(Two-Teacher One-Student, TTOS)的学习框架,旨在协同完成知识库实体的精准检索与自然流畅的对话生成任务。TTOS通过融合两个教师网络的知识,为构建高质量的任务导向型对话系统(即学生网络)提供全面指导。每个教师网络均采用基于目标特定奖励的强化学习进行训练,可视为对应任务目标的专家,并将自身的专业特性有效传递给学生网络。与传统师生学习范式中强制学生网络输出严格模仿教师网络软标签的做法不同,本文引入两个判别器(discriminators),借鉴生成对抗网络(GAN)的思想,实现从双教师到学生的知识迁移。该机制有效缓解了学生网络与教师网络之间的刚性耦合问题。在两个基准数据集(CamRest与In-Car Assistant)上的大量实验结果表明,TTOS显著优于现有基线方法。

基于对抗训练的双教师知识融合任务导向对话系统 | 最新论文 | HyperAI超神经