
摘要
本文研究了将非常大的信息网络嵌入低维向量空间的问题,这在许多任务中都非常有用,例如可视化、节点分类和链接预测。现有的大多数图嵌入方法无法扩展到通常包含数百万个节点的真实世界信息网络。在本文中,我们提出了一种新的网络嵌入方法,称为“LINE”,该方法适用于任意类型的信息网络:无向、有向和/或加权网络。该方法通过优化一个精心设计的目标函数来保留网络的局部和全局结构。提出了一种边采样算法,解决了经典随机梯度下降的局限性,并提高了推理的有效性和效率。实验证明,LINE在各种真实世界的信息网络上具有有效性,包括语言网络、社交网络和引文网络。该算法非常高效,能够在典型的单机上几小时内学习包含数百万个顶点和数十亿条边的网络的嵌入表示。LINE的源代码已在线提供。