3 个月前

知识图谱嵌入如何外推至未见数据:一种语义证据视角

Ren Li, Yanan Cao, Qiannan Zhu, Guanqun Bi, Fang Fang, Yi Liu, Qian Li
知识图谱嵌入如何外推至未见数据:一种语义证据视角
摘要

知识图谱嵌入(Knowledge Graph Embedding, KGE)旨在学习实体与关系的低维表示。目前,大多数KGE模型在推理(extrapolation)场景下取得了显著成功。具体而言,对于未在训练集中出现的三元组(h, r, t),经过训练的模型仍能准确预测缺失的头实体 h(即 ? r t)或尾实体 t(即 h r ?),这种对未见数据的泛化能力令人印象深刻。然而,现有大多数KGE研究主要聚焦于设计精细的三元组建模函数,其核心目标是衡量已观测三元组的合理性,却难以解释为何这些方法具备良好的外推能力,也未明确揭示促进KGE外推的关键因素。因此,本文致力于从两个方面深入探究KGE的外推机制:(1)KGE是如何实现对未见数据的外推的?(2)如何设计具备更强外推能力的KGE模型?针对第一个问题,我们从关系、实体和三元组三个层次系统分析了影响外推能力的关键因素,提出了三种可从训练集中观测到的语义证据(Semantic Evidences, SEs),这些证据能够为外推提供重要的语义信息。通过在多种典型KGE方法上的大量实验,我们验证了所提SEs的有效性。针对第二个问题,为更充分地利用上述三个层次的语义证据,我们提出了一种新型基于图神经网络(GNN)的KGE模型——语义证据感知图神经网络(Semantic Evidence-aware Graph Neural Network, SE-GNN)。在SE-GNN中,每一层次的语义证据均通过对应的邻域模式进行显式建模,并借助多层聚合机制实现充分融合,从而获得更具外推能力的知识表示。最终,在FB15k-237与WN18RR两个标准数据集上的大量实验表明,SE-GNN在知识图谱补全任务中达到了当前最优性能,并展现出显著优于现有方法的外推能力。本文代码已开源,地址为:https://github.com/renli1024/SE-GNN。