
要約
教師なしグラフ表現学習は、さまざまなグラフ情報を、下流タスクに依存しない高密度ベクトル表現に要約することを目的としている。しかし、既存のグラフ表現学習手法は、主にノード同質性(node homophily)の仮定の下で設計されており、接続されたノードは類似したラベルを持つ傾向があるという前提に基づき、ノード中心の下流タスクにおける性能を最適化している。このような設計は、タスクに依存しない原則と明らかに矛盾しており、ノード視点や同質性仮定を超える特徴信号を必要とするタスク、例えばエッジ分類においては、一般的に劣った性能を示す。本稿では、異なる特徴信号を表現に統合するために、ペア化された2つのノードを埋め込みの基本単位として用いる新たな教師なしグラフ埋め込み手法PairEを提案する。この手法は、ノード間の高周波信号を保持することで、ノード関連およびエッジ関連のタスクをサポートすることを目的としている。それに伴い、2つの前処理タスク(pretext tasks)を実現するマルチ自己教師付きオートエンコーダを設計した。1つのタスクは高周波信号の保持を強化し、もう1つのタスクは共通性の表現を強化する。多様なベンチマークデータセットにおける広範な実験の結果、PairEは教師なしの最先端手法を明確に上回り、高周波および低周波信号の両方を必要とするエッジ分類タスクにおいて最大101.1%の相対的な性能向上を達成した。また、ノード分類タスクにおいても最大82.5%の相対的性能向上が確認された。