
摘要
知识图谱(Knowledge Graph, KG)是一种多关系图结构,其中实体作为节点,实体之间的关系则以带类型的边表示。知识图谱问答(KGQA)任务的目标是针对知识图谱回答自然语言查询。多跳KGQA需要在知识图谱中对多个边进行推理,以得出正确答案。然而,知识图谱通常存在大量缺失链接,导致图谱不完整,这为KGQA任务,尤其是多跳KGQA带来了额外挑战。近年来,针对多跳KGQA的研究尝试通过引入相关的外部文本信息来缓解知识图谱稀疏性问题,但这类外部文本并非总是可获得。与此同时,另一类研究提出了知识图谱嵌入(KG embedding)方法,通过预测缺失链接来降低知识图谱的稀疏性。尽管这类方法在相关性上具有显著优势,但迄今为止尚未被应用于多跳KGQA任务。本文填补了这一研究空白,提出了一种名为EmbedKGQA的新方法。EmbedKGQA在稀疏知识图谱上执行多跳KGQA方面表现出色。此外,该方法还打破了以往多跳KGQA方法所施加的“答案必须来自预定义邻域”这一次优约束,从而提升了推理的灵活性。通过在多个基准数据集上的大量实验,我们验证了EmbedKGQA相较于其他先进基线方法的优越性能。