15日前
コミュニティ表現とノード表現のギャップを埋める:コミュニティ検出を用いたグラフ埋め込み
Artem Lutov, Dingqi Yang, Philippe Cudré-Mauroux

要約
グラフ埋め込みは、多くのデータマイニングおよび分析システムの重要な構成要素となっている。現在のグラフ埋め込み手法は、主に2つのアプローチに分類される。一つは、確率的最適化を用いてノード埋め込みを学習するため、グラフから多数のノードペアをサンプリングする方法であり、もう一つは、高次近接性/隣接行列を計算的に高コストな行列因子分解技術で分解する方法である。これらの手法は通常、学習プロセスに膨大なリソースを要し、複数のパラメータに依存しているため、実用的な応用において制限がある。さらに、既存の多くは特定の距離空間(例えばコサイン類似度によって生成される空間)でのみ効果的に動作し、入力グラフの高次構造的特徴を保持できず、埋め込み次元数を意味のある形で自動的に決定できない。また、通常得られる埋め込みは直感的に解釈しにくく、これによりさらなる解析が困難になり、応用範囲が制限される。こうした課題に対処するため、本研究では、手動のチューニングを一切不要とし、メトリック空間に頑健で、コンパクトかつ解釈可能な埋め込みを生成する、極めて効率的かつパラメータフリーなグラフ埋め込み手法DAORを提案する。多数の最先端グラフ埋め込みアルゴリズムと比較して、DAORはノード分類(高次近接性に依存)およびリンク予測(主に低次近接性に依存)の両タスクにおいて競争力のある性能を示す。しかし、既存手法とは異なり、DAORはパラメータのチューニングを必要とせず、埋め込み生成速度を数桁以上向上させる。本手法は、グラフ表現学習を伴うデータ解析タスクを大幅に簡素化し、高速化するという目標を持つ。