ラベリングトリック:グラフニューラルネットワークを用いた多ノード表現学習の理論

本論文では、グラフニューラルネットワーク(GNN)を用いた複数ノード表現学習の理論を提供します(ここでは、リンクなど、1つ以上のノードの集合の表現を学習することに興味があります)。GNNは単一ノードの表現を学習するために設計されています。複数ノードが関与するノード集合の表現を学習したい場合、従来の研究では、GNNによって得られた単一ノードの表現を直接集約して共同のノード集合表現を作成することが一般的な手法でした。本論文では、そのようなアプローチにおける基本的な制約、すなわちノード集合内のノード間の依存関係を捉えることができないことを示し、個々のノード表現を直接集約することは効果的な複数ノードの共同表現にはならないと主張します。次に、SEALやDistance Encoding、ID-GNNなどの複数ノード表現学習で成功したいくつかの先行研究に注目しました。これらの方法は、GNNを適用する前にターゲットとなるノード集合との関係に基づいてグラフ内のノードをラベリングします。その後、ラベリングされたグラフで得られたノード表現が集約されてノード集合表現となります。これらの内部メカニズムを調査することで、これらのノードラベリング技術を最も一般的な形である「ラベリングトリック」に統一しました。我々は証明しました、「ラベリングトリック」を使用することで十分に表現力のあるGNNは最も表現力のあるノード集合表現を学習できることから、原理的には任意の複数ノード上の共同学習タスクを解決できるということです。重要な2つのノード表現学習タスクであるリンク予測に関する実験により、我々の理論が検証されました。本研究は、従来のラベル付けベースの方法が優れた性能を持つ理由を説明し、GNNを使用した複数ノード表現学習における理論的基盤を確立しています。