摘要
响应选择是人工智能领域的一个关键问题,在网络应用中具有重要意义。然而,由于缺乏上下文感知能力,所选响应的准确性往往不足,尤其是在开放域对话中,词语在不同语境下可能具有多种含义。为此,我们提出了SemSol——一种具备知识感知能力的响应选择模型。该模型通过利用对话过程中用户之间隐式共享的词语上下文语义,有效应对这一挑战。SemSol在开放域知识图谱(如WordNet)的基础上,同时学习对话中词语的词义消歧(Word Sense Disambiguation, WSD),并建模对话上下文与候选响应之间的匹配关系。在此基础上,SemSol结合对话上下文,充分挖掘知识图谱中的语义信息,从而提升响应选择的准确性。此外,该模型在整体训练数据集的语境下学习话语的主题信息,所获得的主题级知识能够为对话上下文提供具有主题特异性的语义支持,进一步优化词义消歧效果,提升响应选择的精度。在两个开放域对话数据集——中文的Douban和英文的Reddit上的实验结果表明,SemSol显著优于当前最先进的基线模型。目前,SemSol在Douban排行榜上位列第一。