摘要

知识图谱中的链接预测任务旨在预测实体之间缺失的关系。以往的链接预测研究主要集中在浅层、快速模型上，这些模型可以扩展到大型知识图谱。然而，这些模型学习到的特征不如深层、多层模型丰富——这可能限制了其性能。在本工作中，我们引入了一种名为ConvE的多层卷积网络模型用于链接预测，并报告了在多个已建立的数据集上的最新结果。此外，我们还展示了该模型具有极高的参数效率，在参数数量减少8倍和17倍的情况下，仍能分别达到与DistMult和R-GCN相同的性能。对我们的模型分析表明，它特别擅长建模入度较高的节点——这类节点在高度连接且复杂的知识图谱（如Freebase和YAGO3）中非常普遍。此外，已经指出WN18和FB15k数据集存在测试集泄露问题，即训练集中存在的逆关系出现在测试集中——但这一问题的程度尚未量化。我们发现这个问题非常严重：一个简单的基于规则的模型可以在WN18和FB15k上实现最新的性能水平。为了确保模型在无法仅通过利用逆关系获得有竞争力结果的数据集上进行评估，我们调查并验证了几种常用的数据集——必要时推导出稳健的变体。然后我们在这些稳健的数据集上对我们的模型以及几种先前提出的模型进行了实验，并发现ConvE在大多数数据集上实现了最先进的平均倒数排名（Mean Reciprocal Rank）。

源 PDF