
摘要
在本文中,我们提出了一种使用图神经网络(GNNs)进行多节点表示学习的理论框架(即对一组超过一个节点的学习表示感兴趣,例如链接)。我们知道,GNN 是设计用于学习单个节点表示的。当需要学习涉及多个节点的节点集合表示时,以往研究中的常见做法是直接将 GNN 获得的单个节点表示聚合为一个联合的节点集合表示。在本文中,我们揭示了这种方法的一个基本限制,即无法捕捉节点集合内节点之间的依赖关系,并论证了直接聚合单个节点表示并不能产生有效的多节点联合表示。随后,我们注意到一些成功的多节点表示学习方法,包括 SEAL、距离编码(Distance Encoding)和 ID-GNN,都采用了节点标记技术。这些方法首先根据目标节点集合与图中其他节点的关系对图中的节点进行标记,然后再应用 GNN。接着,将标记后的图中获得的节点表示聚合为一个节点集合表示。通过研究这些方法的内部机制,我们将这些节点标记技术统一为一种最通用的形式——标记技巧(labeling trick)。我们证明了,在使用标记技巧的情况下,具有足够表达能力的 GNN 可以学习到最具表达力的节点集合表示,从而原则上可以解决任何关于节点集合的联合学习任务。我们在一个重要的一对二节点表示学习任务——链接预测上进行了实验验证,结果支持了我们的理论。我们的工作解释了先前基于节点标记的方法表现出色的原因,并为使用 GNN 进行多节点表示学习奠定了理论基础。