
摘要
在大规模不完整知识图谱(KGs)上回答复杂的逻辑查询是一项基本而具有挑战性的任务。最近,一种有前景的方法是将知识图谱实体和查询嵌入到向量空间中,使得能够回答查询的实体在向量空间中靠近查询。然而,先前的研究将查询建模为向量空间中的单个点,这存在一个问题,因为一个复杂的查询可能代表其答案实体的一个潜在较大的集合,但如何将这样一个集合表示为单个点尚不清楚。此外,先前的工作只能处理使用合取($\wedge$)和存在量化($\exists$)的查询。处理包含逻辑析取($\vee$)的查询仍然是一个未解决的问题。本文提出了一种基于嵌入的框架——query2box,用于在大规模且不完整的知识图谱中处理任意包含 $\wedge$、$\vee$ 和 $\exists$ 操作符的逻辑查询。我们的主要见解是,可以将查询嵌入为盒子(即超矩形),其中盒子内部的一组点对应于查询的答案实体集。我们展示了合取可以自然地表示为盒子的交集,并证明了一个负面结果:处理析取需要维度与知识图谱实体数量成比例的嵌入。然而,通过将查询转换为析取范式(Disjunctive Normal Form),我们表明 query2box 能够以可扩展的方式处理任意包含 $\wedge$、$\vee$ 和 $\exists$ 的逻辑查询。我们在三个大型知识图谱上验证了 query2box 的有效性,并显示 query2box 在这些数据集上的表现比现有最佳方法提高了高达 25% 的相对性能。