
要約
本稿では、ogbl-citation2における欠落リンク予測タスクに対して、2つの局所的グラフ特徴量を導入する。これらの特徴量を「サークル特徴量(Circle Features)」と定義し、友人サークル(circle of friends)の概念を借用している。本研究では、上記特徴量の詳細な計算式を提案する。まず、第一のサークル特徴量として、双部グラフ(bipartite graph)から導出される修正スイング(modified swing)を定義する。次に、第二のサークル特徴量として、異なる友人サークル間において2つのノードが果たす橋渡し的役割の重要性を示す「ブリッジ(bridge)」を定義する。さらに、これらの特徴量をバイアスとして初めて提案し、グラフ変換器ニューラルネットワークの性能を向上させるための工夫を行う。これにより、グラフ自己注意機構(graph self-attention mechanism)の表現力を強化する。本研究では、SIEGネットワークに基づき、二重タワー構造を採用してグローバル構造と局所構造の両方の特徴を捉える「サークル特徴量認識型グラフ変換器(Circled Feature aware Graph Transformer, CFG)」モデルを実装した。実験結果から、CFGはogbl-citation2データセットにおいて、最先端(state-of-the-art)の性能を達成したことが確認された。