CAT:異種結合性グラフのトリミングをための因果的グラフアテンションネットワーク

グラフ注意力ネットワーク(GAT)に採用されるローカル注意力誘導型メッセージパッシング機構(LAMP)は、グラフ上の局所的集約をより効果的に行うために、隣接ノードの重要性を適応的に学習するように設計されており、類似する隣接ノードの表現を効果的に近づけることにより、より強固な識別能力を発揮する。しかし、既存のGATは、異質性の高いグラフ(heterophilic graphs)において顕著な識別能力の低下を示す。その理由は、類似しない隣接ノードの割合が高いため、中心ノードの自己注意力(self-attention)が弱まり、結果として表現空間上での中心ノードが類似ノードから逸脱してしまうためである。このような隣接ノードが中心ノードに及ぼす影響を、本論文では「誘導効果(Distraction Effect, DE)」と呼ぶ。DEを推定し、その影響を軽減するために、異質性グラフのトライミングを目的とした因果的グラフ注意力ネットワーク(Causally graph Attention network for Trimming heterophilic graph, CAT)を提案する。DEの推定に関しては、DEが二つの経路(隣接ノードに割り当てられた注意力を奪う、および中心ノードの自己注意力を低下させる)を通じて生成されることに着目し、介入データから推定可能な因果推定量である「総効果(Total Effect)」を用いてDEをモデル化する。DEの軽減のためには、DEが最も高い隣接ノード(本論文では「誘導ノード(Distraction Neighbors)」と呼ぶ)を特定し、それらを削除する。提案するCATフレームワーク内では、代表的な3種類のGATをベースモデルとして採用し、サイズが異なる3種類の7つの異質性データセット上で実験を行った。比較実験の結果、CATはすべてのベースGATモデルにおけるノード分類精度を向上させることを示した。アブレーション実験および可視化により、CATが識別能力を顕著に強化していることがさらに検証された。ソースコードは、https://github.com/GeoX-Lab/CAT にて公開されている。