11日前
大規模グラフにおけるロバスト最適化によるデータ拡張
Kezhi Kong, Guohao Li, Mucong Ding, Zuxuan Wu, Chen Zhu, Bernard Ghanem, Gavin Taylor, Tom Goldstein

要約
データ拡張は、訓練データセットを拡大することでニューラルネットワークの汎化性能を向上させる手法であるが、グラフデータに対して効果的に拡張を行う方法が、まだ未解決の課題として残っている。既存の多数のグラフ正則化手法は、エッジの追加や削除によってグラフのトポロジー構造を操作するにとどまっているが、本研究では、ノード特徴量の拡張を通じてGNN(グラフニューラルネットワーク)の性能を向上させるアプローチを提案する。本研究では、トレーニング中に勾配ベースの敵対的摂動を用いてノード特徴量を反復的に拡張する「FLAG(Free Large-scale Adversarial Augmentation on Graphs)」を提案する。この手法により、モデルが入力データの微小な変動に対して不変となるように学習させることで、分布外のサンプルに対する汎化性能が向上し、テスト時のモデル性能が著しく向上する。FLAGはノード分類、リンク予測、グラフ分類といったさまざまなグラフデータタスクに普遍的に適用可能な汎用的手法であり、任意のGNNバックボーンと大規模データセットに対しても高い柔軟性とスケーラビリティを備え、容易に導入可能である。広範な実験およびアブレーションスタディを通じて、本手法の有効性と安定性を実証した。さらに、本手法の挙動をより深く理解するための直感的な観察も提示している。