
グラフニューラルネットワーク(GNN)は、グラフデータのモデリングに広く用いられ、ノード分類やリンク予測タスクにおいて優れた成果を上げている。しかし、グラフの正確な表現を得るためには、ノード表現の集合をコンパクトな形にマッピングするプーリング関数の導入が不可欠である。従来の単純なノード表現の和または平均によるプーリング手法は、すべてのノード特徴量に等しい重みを割り当て、それらのタスクにおける関連性や、ノード間の構造的依存関係を考慮しないという課題を抱えている。一方で、最近提案された階層的グラフプーリング手法は、Weisfeiler-Lehman(WL)同型性テストによって区別可能な2つの異なるグラフに対して同じ表現を出力する可能性があり、ノード特徴からの情報の不適切な保持が原因である。こうした既存のグラフプーリング手法の限界を克服するため、本研究では、グラフ構造に関する補助情報を含む多集合符号化問題としてグラフプーリング問題を定式化し、構造的依存関係に基づいてノード間の相互作用を捉えることができる、マルチヘッドアテンションに基づくグローバルプーリング層である「グラフ多集合トランスフォーマー(Graph Multiset Transformer, GMT)」を提案する。我々は、GMTが単射性(injectiveness)と順列不変性(permutation invariance)を満たすことを示し、その表現力がWeisfeiler-Lehmanグラフ同型性テストと同等、あるいはそれ以上であることを確認した。さらに、本手法は従来のノードクラスタリングアプローチに容易に拡張可能であり、階層的グラフプーリングに応用できる。実験結果から、GMTはグラフ分類ベンチマークにおいて、最先端のグラフプーリング手法を大きく上回る性能を発揮し、メモリ効率と実行時間の面でも優れた効率性を示した。また、グラフ再構成および生成タスクにおいては、さらに顕著な性能向上が得られた。