摘要
构建一个能够根据多轮对话上下文选择恰当回复的智能对话系统,在三个方面面临挑战:(1)上下文与回复对的语义依赖于多种粒度的语言单元(例如词汇、短语及子句等);(2)对话数据中可能存在局部依赖(如围绕某个词的小范围上下文)和长程依赖(如跨越上下文与回复的远距离词语关联);(3)在实际场景中,上下文与候选回复之间的语义关系可能由多个相关语义线索构成,或在某些情况下表现为相对隐含的语义关联。然而,现有方法通常采用单一类型的表示方式对对话进行编码,且上下文与候选回复之间的交互过程往往较为浅层,这可能导致对对话内容理解不充分,并阻碍对上下文与回复之间语义相关性的准确识别。为应对上述挑战,本文提出一种“表示[K]–交互[L]–匹配”框架,通过探索多种深度交互式表示,构建用于回复选择的上下文-回复匹配模型。具体而言,我们为话语-回复对构建多种类型的表示,并通过交替编码与交互机制不断深化这些表示。该机制使模型能够在表示学习过程中有效捕捉相邻元素间的关系、短语模式以及长距离依赖,并通过上下文-回复对之间多层交互实现更精确的语义匹配与预测。在三个公开基准数据集上的实验结果表明,所提出的模型显著优于以往传统的上下文-回复匹配模型,在基于检索的对话系统中进行多轮回复选择时,性能也略优于BERT模型。