
摘要
知识库补全问题可以被表述为一个三阶二元张量补全问题。从这个角度来看,经典张量分解(CP)(Hitchcock,1927)似乎是一个自然的选择;然而,目前在标准知识库补全基准测试中,CP的实现落后于其竞争对手。在这项工作中,我们试图理解CP在知识库补全中的局限性。首先,我们提出并测试了一种基于张量核$p$-范数的新正则化方法。然后,我们提出了一个问题的重新表述方法,使其对数据集中谓词及其逆谓词的任意选择具有不变性。这两种方法结合使用后,使我们能够在多个数据集上通过CP分解超越当前的最佳水平,并且使用更先进的ComplEx模型获得了更好的结果。