異質性スノーフレーク仮説:異質性グラフにおけるGNNの訓練と強化

グラフニューラルネットワーク(GNN)は、グラフベースの学習タスクにおいて中心的な役割を果たすツールとして広く用いられている。特に、現在の多数のGNNアーキテクチャは、明示的または暗黙的に「同質性(homophily)」の仮定に基づいている。この仮定は頻繁に採用されているが、すべてのグラフ構造に適用可能というわけではなく、学習効果に潜在的な限界をもたらすことがある。本論文では、初めて「1ノード=1つの受容野(receptive field)」という既存の概念を異質性(heterophily)を持つグラフに適用する。代理ラベル予測器(proxy label predictor)を構築することで、各ノードが潜在的な予測分布を持つことができ、接続されたノードが隣接ノードを統合すべきかどうかを判断する手助けを可能にする。その結果、各ノードは独自の集約ホップ数とパターンを持つことが可能となり、まるで一つの雪の結晶がそれぞれに独自の形状を持つように、個別性を有する。この観察に基づき、本研究では画期的に「異質性雪の結晶仮説(Heterophily Snowflake Hypothesis)」を提唱し、異質性グラフおよびそれ以上の領域における研究を導く有効な解決策を提供する。実験は以下の4つの観点から包括的に行われた:(1)10種類の異なる異質性比率を持つグラフにおいて、10種類のバックボーンを用いた主実験;(2)SGC、JKNetなど複数の深層GNNバックボーンを用いたスケーラビリティ評価(2~32層まで);(3)従来の雪の結晶仮説との比較;(4)既存のグラフプリューニングアルゴリズムとの効率比較。実験結果から、本フレームワークが多様なタスクに対して汎用的な演算子として機能することが示された。このフレームワークは、さまざまなGNNアーキテクチャに統合可能であり、性能向上を深く実現するとともに、最適なネットワーク深さを選定する説明可能(explainable)なアプローチを提供する。ソースコードは以下のURLで公開されている:\url{https://github.com/bingreeky/HeteroSnoH}。