15日前
グラフニューラルネットワークにおけるデータ拡張
Tong Zhao, Yozen Liu, Leonardo Neves, Oliver Woodford, Meng Jiang, Neil Shah

要約
データ拡張(data augmentation)は、機械学習モデルの汎化性能を向上させるために広く用いられている。しかし、グラフデータに対するデータ拡張に関する研究は比較的少ない。これは、グラフが複雑で非ユークリッド的な構造を持つため、可能な操作が制限されることが主な理由である。画像や自然言語処理で一般的に用いられる拡張手法には、グラフに対して直接対応する類似手法が存在しない。本研究では、半教師付きノード分類の文脈において、グラフニューラルネットワーク(GNN)に対するグラフデータ拡張について検討する。実用的および理論的な動機、考慮すべき点、戦略について議論し、ニューラルエッジ予測器がクラス内同質性(class-homophilic)構造を効果的に表現でき、与えられたグラフ構造においてクラス内エッジを強化しクラス間エッジを抑制することを示す。本研究の主な貢献は、これらの知見を活用してエッジ予測を通じてGNNベースのノード分類性能を向上させる、GAugというグラフデータ拡張フレームワークの提案である。複数のベンチマークにおける広範な実験により、GAugを用いたデータ拡張が、さまざまなGNNアーキテクチャおよびデータセットにおいて性能の向上を実現することが確認された。