2ヶ月前
PyTorch-BigGraph: 大規模グラフ埋め込みシステム
Adam Lerer; Ledell Wu; Jiajun Shen; Timothee Lacroix; Luca Wehrstedt; Abhijit Bose; Alex Peysakhovich

要約
グラフ埋め込み手法は、グラフから教師なしでノードの特徴を生成し、機械学習タスクに利用することができます。現代のグラフ、特に産業応用におけるものは、数十億のノードと数兆のエッジを含んでおり、既存の埋め込みシステムの能力を超えています。本稿では、PyTorch-BigGraph (PBG) を紹介します。これは伝統的な多関係埋め込みシステムに対するいくつかの改良を加えたもので、数十億のノードと数兆のエッジを持つグラフに対してスケーリングが可能となっています。PBG はグラフ分割を使用して、単一マシンまたは分散環境において任意の大きさの埋め込みを訓練します。一般的なベンチマークでの性能は既存の埋め込みシステムと同等でありながら、任意の大規模グラフへのスケーリングや複数マシン間での並列化が可能です。私たちは PBG を用いて、大規模なソーシャルネットワークグラフや1億以上のノードと20億以上のエッジを含むフル Freebase データセット上で埋め込みを訓練し評価しました。