2 个月前
知识图谱嵌入的快速生成
Tommaso Soru; Stefano Ruberto; Diego Moussallem; André Valdestilhas; Alexander Bigerl; Edgard Marx; Diego Esteves

摘要
知识图谱嵌入方法旨在将知识库中的实体和关系表示为连续向量空间中的点或向量。利用嵌入的方法在诸如链接预测、实体推荐、问答和三元组分类等任务中已经显示出令人鼓舞的结果。然而,只有少数方法能够在不需要最先进计算资源的情况下计算出非常大规模知识库的低维嵌入。本文提出了一种基于跳字模型(skip-gram model)的简单且快速的知识图谱嵌入方法——KG2Vec。我们不使用预定义的评分函数,而是依赖长短期记忆网络(Long Short-Term Memories, LSTM)来学习该函数。实验结果表明,我们的嵌入方法在知识图谱补全任务上以及在一个新的度量指标上的表现与最可扩展的方法相当。此外,KG2Vec可以在不到7小时内处理超过2.5亿个三元组,从而在普通硬件上实现对大规模图谱的快速嵌入。