
要約
現代のグラフ埋め込み手法は、数百万ノードを含むグラフからノードの特徴を効率的に抽出できる。これらの特徴は、その後、下流の予測タスクへの入力として用いられる。本論文では、ノードの特徴計算と同時にノードのクラスタリングを学習するグラフ埋め込み手法GEMSECを提案する。この手法は、抽象的な特徴空間内にノードを配置し、その際、サンプリングされたノード近傍の保存確率の負の対数尤度を最小化するようなノード特徴を学習するとともに、この空間内で固定数のクラスタにノードを分割する。GEMSECは、従来のシーケンスベースのグラフ埋め込み手法のコア最適化問題を拡張した汎用的なアプローチであり、近傍サンプリング戦略に依存しない(アノン)特徴を持つ。実世界のソーシャルネットワークにおいてGEMSECが高品質なクラスタを抽出でき、他のコミュニティ検出アルゴリズムと同等の性能を発揮することを示す。また、クラスタリング制約が表現品質に正の影響を与えること、および本手法が堅牢かつスケーラブルな形でグラフの埋め込みとクラスタリングを同時に学習できることを実証した。