2 个月前
PyTorch-BigGraph:大规模图嵌入系统
Adam Lerer; Ledell Wu; Jiajun Shen; Timothee Lacroix; Luca Wehrstedt; Abhijit Bose; Alex Peysakhovich

摘要
图嵌入方法从图中生成无监督的节点特征,这些特征可以用于各种机器学习任务。现代图,尤其是在工业应用中,包含数十亿个节点和数万亿条边,这超出了现有嵌入系统的处理能力。我们提出了PyTorch-BigGraph(PBG),这是一种对传统多关系嵌入系统进行若干改进的嵌入系统,使其能够扩展到包含数十亿个节点和数万亿条边的图上。PBG通过图划分技术在单机或分布式环境中训练任意大小的嵌入。我们在常见的基准测试中展示了与现有嵌入系统相当的性能,同时支持扩展到任意大的图并在多台机器上并行化。我们还在几个大型社交网络图以及完整的Freebase数据集上训练和评估了嵌入,该数据集包含超过1亿个节点和20亿条边。