11日前

Graph InfoClust:クラスタレベルのノード情報を利用した教師なしグラフ表現学習

Costas Mavromatis, George Karypis
Graph InfoClust:クラスタレベルのノード情報を利用した教師なしグラフ表現学習
要約

教師なし(または自己教師あり)のグラフ表現学習は、外部のラベル情報が利用できない状況下で、さまざまなグラフデータマイニングタスクを促進するために不可欠である。その課題は、グラフ構造およびノード・エッジに付随する属性情報を、低次元空間に効果的に符号化することにある。既存の多くの教師なし手法は、トポロジカルに近接するノード間で類似した表現を促進するが、最近の研究では、すべてのノードに共通するグラフレベルの情報を活用することで、表現がグラフのグローバルな性質に注意を向けるようになり、表現の品質が大幅に向上することが示された。しかし、多数のグラフでは、さらに多くの構造的パターンが捉えられる余地がある。例えば、ノードは構造的に類似した部分群(クラスタ)に属する傾向がある(複数のクラスタに属する場合も含む)。この観察に着目し、本研究では、クラスタレベルの情報コンテンツを追加で捉えることを目的としたグラフ表現学習手法「Graph InfoClust(GIC)」を提案する。本手法では、微分可能なK-means法を用いてクラスタを計算し、同じクラスタに属するノード間の相互情報量を最大化することで、クラスタ構造とノード表現を共同最適化する。この最適化により、ノード表現はより豊かな情報とノード間の相互作用を捉えるようになり、表現品質が向上する。実験の結果、GICはノード分類、リンク予測、ノードクラスタリングといった複数の下流タスクにおいて、最先端手法を上回る性能を示した。特に、最も優れた競合手法と比較して、平均で0.9%~6.1%の性能向上が達成された。

Graph InfoClust:クラスタレベルのノード情報を利用した教師なしグラフ表現学習 | 最新論文 | HyperAI超神経