
摘要
网络嵌入在网络特征表示学习中变得非常流行。受到嵌入在自然语言处理领域近期成功应用的启发,研究人员尝试寻找网络嵌入,以便利用机器学习算法进行节点分类和边预测等挖掘任务。然而,大多数研究工作集中在寻找节点的分布式表示,这些表示对于社区检测等依赖子图的任务并不适合。在此背景下,我们提出了一种无监督且可扩展的算法——sub2vec,用于学习任意子图的特征表示。我们提供了一种方法来表征子图之间的相似性,并对sub2vec进行了理论分析,证明了它能够保留所谓的局部邻近性。此外,我们通过将sub2vec应用于网络挖掘任务(如社区检测)来突出其可用性。实验结果表明,sub2vec在性能上显著优于现有方法和节点嵌入方法。特别是,sub2vec提供了一种生成更丰富的子图特征词汇的方法,以支持表示和推理。