Bowen Fan Yuming Ai Xunkai Li Zhilin Guo Rong-Hua Li Guoren Wang

要約
グラフ機械学習は、関係データの理解および解析に不可欠である。しかし、プライバシーに敏感なアプリケーションでは、訓練済みのグラフニューラルネットワーク(GNN)からセンシティブな情報を効率的に削除できる能力が求められる。これは、モデルを再訓練する際の不要な時間およびメモリのオーバーヘッドを回避するためである。この課題に対応するため、グラフアンリーニング(Graph Unlearning, GU)が重要な解決策として注目されている。GUは、データ管理システムにおける動的グラフ更新をサポートし、分散データシステムにおけるスケーラブルなアンリーニングを実現しつつ、プライバシー準拠を確保する可能性を有している。コンピュータビジョンなど他の分野における機械学習のアンリーニングとは異なり、GUはグラフデータの非ユークリッド構造およびGNNの再帰的なメッセージパッシング機構によって、独自の困難に直面している。さらに、下流タスクの多様性とアンリーニング要求の複雑さが、これらの課題をさらに複雑化している。多様なGU手法が提案されているにもかかわらず、GUの公平な比較を可能にするベンチマークの不在、および下流タスクとアンリーニング要求の組み合わせにおける柔軟性の欠如により、評価の不整合が生じており、この分野の発展を阻害している。このギャップを埋めるために、本研究では、16の最先端(SOTA)GUアルゴリズムと37の多分野にまたがるデータセットを統合した、最初のGUベンチマーク「OpenGU」を提案する。OpenGUは、13種類のGNNバックボーンを用いて、柔軟なアンリーニング要求に応じて多様な下流タスクを実行可能にしている。この統一されたベンチマークフレームワークに基づき、GUに対して包括的かつ公平な評価が可能となる。広範な実験を通じて、既存のGU手法に関する重要な知見を明らかにした一方で、それらの限界についても貴重な洞察を得ることができ、今後の研究の可能性を示唆する結果が得られた。