
要約
大規模グラフにおけるノードの低次元埋め込みは、コンテンツ推薦からタンパク質機能の同定まで、さまざまな予測タスクにおいて非常に有用であることが証明されています。しかし、既存の大多数の手法は、埋め込みの学習中にグラフ内のすべてのノードが存在することを必要とします。これらの従来の手法は本質的に転移的であり、未見ノードへの自然な一般化が困難です。本稿では、GraphSAGEという一般的な帰納的フレームワークを提案します。このフレームワークは、ノード特徴情報(例:テキスト属性)を活用して効率的に未見データに対するノード埋め込みを生成します。各ノードごとの個別の埋め込みを学習する代わりに、我々は近傍からの特徴をサンプリングおよび集約する関数を学習することで埋め込みを生成します。我々のアルゴリズムは3つの帰納的ノード分類ベンチマークで強力な基線モデルを上回っています。引用データやReddit投稿データに基づく進化する情報グラフにおける未見ノードのカテゴリ分類を行い、さらに複数グラフデータセットを使用して完全に未見のプロテイン-プロテイン相互作用グラフへの一般化能力も示しています。