
要約
本研究では、新たなリンク予測モデルを提案し、さらにグラフの不完全性に関する考察を通じてその性能を向上させた。まず、構造的特徴(Structural Feature, SF)を用いてMPNNの表現プーリングをガイドする革新的なアーキテクチャ「MPNN-then-SF」を導入する。その実装として、Neural Common Neighbor(NCN)を提案する。NCNは従来のモデルと比較して、表現力およびスケーラビリティにおいて優れた性能を示す。従来のモデルは大きく2つのカテゴリに分類される:SF-then-MPNN(SFをMPNNの入力に付加する方式)とSF-and-MPNN(SFとMPNNを分離して処理する方式)。次に、入力グラフに観測されていないリンクが存在する「グラフの不完全性」という現象が、共通近傍(common neighbor)を含む構造的特徴に与える影響を調査する。データセットの可視化により、不完全性が共通近傍の数を減少させ、特徴分布のシフトを引き起こすことが明らかとなり、これがモデルの性能に顕著な影響を与えることが分かった。この問題に対処するため、リンク予測モデルを用いて共通近傍構造を補完する手法を提案する。このアプローチをNCNと組み合わせることで、補完を含むNeural Common Neighbor(NCNC)を構築した。NCNおよびNCNCは、最近の強力なベースラインモデルを大きく上回り、特にNCNCは標準的なリンク予測ベンチマークにおいて最先端のモデルを上回る性能を達成した。本研究のコードは、https://github.com/GraphPKU/NeuralCommonNeighbor にて公開されている。