16日前
効率的な部分グラフベースグラフ表現学習のためのアルゴリズムとシステムの共同設計
Haoteng Yin, Muhan Zhang, Yanbang Wang, Jianguo Wang, Pan Li

要約
サブグラフベースのグラフ表現学習(SGRL)は、従来のグラフニューラルネットワーク(GNN)が直面するいくつかの根本的な課題に対処するために最近提案された手法であり、リンク予測、関係予測、モチーフ予測など、多くの重要なデータサイエンス応用において優れた性能を示している。しかし、現在のSGRL手法は、各トレーニングまたはテストクエリに対してサブグラフを抽出する必要があるため、スケーラビリティの問題に直面している。近年の従来GNNのスケーラビリティ向上を目的とした手法は、SGRLには直接適用できない場合が多い。本研究では、学習アルゴリズムとそのシステム支援を共同設計することで、スケーラブルなSGRLを実現する新しいフレームワークSURELを提案する。SURELは、ウォークに基づくサブグラフ分解を採用し、同じウォークを再利用してサブグラフを構成することで、サブグラフ抽出の冗長性を大幅に低減し、並列計算を可能にしている。数百万ノードおよびエッジを有する6種類の同質的・非同質的・高次のグラフ上で実施した実験により、SURELの有効性とスケーラビリティが確認された。特に、SGRLのベースライン手法と比較して、SURELは予測性能に劣らず、あるいはそれ以上を維持しつつ10倍の高速化を達成した。また、従来のGNNと比較して、予測精度を50%向上させた。