
摘要
在本工作中,我们提出了一种新颖的链接预测模型,并通过研究图结构的不完整性进一步提升了模型性能。首先,我们引入了一种创新架构——MPNN-then-SF,该架构利用结构特征(Structural Feature, SF)引导消息传递神经网络(MPNN)的表示聚合过程,其具体实现称为神经公共邻居(Neural Common Neighbor, NCN)。与现有模型相比,NCN展现出更优的表达能力和可扩展性。现有模型主要可分为两类:一类为SF-then-MPNN,通过在MPNN输入中引入结构特征进行增强;另一类为SF-and-MPNN,将结构特征与MPNN解耦处理。其次,我们系统研究了图结构不完整性——即输入图中部分边未被观测到——对结构特征(如公共邻居)的影响。通过数据集可视化分析,我们发现图的不完整性会显著减少公共邻居数量,并引发特征分布偏移,从而严重影响模型性能。为应对这一问题,我们提出利用链接预测模型来补全公共邻居的结构。将该方法与NCN相结合,我们进一步提出了带有结构补全机制的神经公共邻居(Neural Common Neighbor with Completion, NCNC)。实验结果表明,NCN和NCNC在多个主流基准上均显著超越近期强基线模型,而NCNC更进一步超越了当前最先进的方法。相关代码已开源,地址为:https://github.com/GraphPKU/NeuralCommonNeighbor。