
摘要
神经链接预测器在识别大规模知识图谱中的缺失边方面具有极大的实用性。然而,如何利用这些模型来回答多个领域中出现的更复杂的查询仍然是一个未解之谜,尤其是涉及逻辑合取($\land$)、析取($\lor$)和存在量词($\exists$)的查询,同时还要考虑缺失边的问题。在这项工作中,我们提出了一种框架,用于高效地回答不完整知识图谱上的复杂查询。我们将每个查询转换为端到端可微的目标函数,其中每个原子的真值由预训练的神经链接预测器计算得出。随后,我们分析了两种解决优化问题的方法,包括基于梯度的搜索和组合搜索。在实验中,所提出的这种方法在无需大量且多样的复杂查询训练的情况下,比现有方法——即在数百万生成查询上训练的黑盒神经模型——产生了更准确的结果。使用数量级较少的训练数据,我们在包含事实信息的不同知识图谱上获得了从8%到40%不等的Hits@3相对提升。最后,我们展示了可以解释我们的模型对每个复杂查询原子所识别的中间解决方案的结果。我们的所有源代码和数据集均可在线获取,网址为 https://github.com/uclnlp/cqd。