
摘要
低维节点嵌入在大型图中的多种预测任务中已被证明极其有用,从内容推荐到识别蛋白质功能。然而,大多数现有的方法要求在训练嵌入时所有节点都必须存在于图中;这些先前的方法本质上是半监督的,无法自然地推广到未见过的节点。本文介绍了一种名为GraphSAGE的一般归纳框架,该框架利用节点特征信息(例如,文本属性)高效生成之前未见过的数据的节点嵌入。与为每个节点单独训练嵌入不同,我们学习了一个函数,通过采样和聚合节点局部邻域的特征来生成嵌入。我们的算法在三个归纳节点分类基准测试中优于强大的基线方法:我们在基于引用和Reddit帖子数据的演化信息图中对未见过的节点进行分类,并展示了我们的算法可以使用多图数据集中的蛋白质-蛋白质相互作用数据推广到完全未见过的图。