
摘要
知识图谱是一种流行的知识表示格式,广泛应用于语义搜索引擎、问答系统和推荐系统等领域。现实世界中的知识图谱通常存在不完整性,因此提出了诸如规范分解/并行因子化(CP)、DistMult 和 ComplEx 等知识图谱嵌入方法来解决这一问题。这些方法通过在语义空间中将实体和关系表示为嵌入向量,并预测它们之间的链接。嵌入向量本身包含丰富的语义信息,可以用于数据分析等其他应用。然而,这些模型的机制以及嵌入向量本身差异很大,使得理解和比较它们变得困难。由于缺乏理解,我们可能会错误或低效地使用这些模型,尤其是在处理复杂的模型时,例如具有两个角色基嵌入向量的 CP 模型或最先进的具有复数嵌入向量的 ComplEx 模型。本文提出了一种多嵌入交互机制作为统一和泛化这些模型的新方法。我们通过该机制从理论上推导了这些模型,并提供了对它们的经验分析和比较。此外,我们还基于四元数代数提出了一种新的多嵌入模型,并展示了它在常用基准测试中取得了有前景的结果。源代码可在 GitHub 上获取,地址为:https://github.com/tranhungnghiep/AnalyzeKGE。