
要約
ネットワーク埋め込みは、ネットワークの効果的な特徴表現を学習するために非常に注目されています。自然言語処理における埋め込みの最近の成功に触発され、研究者たちは機械学習アルゴリズムをノード分類やエッジ予測などのマイニングタスクに活用するために、ネットワーク埋め込みを見つけることを試みてきました。しかし、ほとんどの研究はノードの分散表現を見つけることに焦点を当てており、コミュニティ検出のようなサブグラフに依存する直感的なタスクには適していないという問題があります。本稿では、任意のサブグラフの特徴表現を学習するための非監督かつスケーラブルなアルゴリズムであるsub2vecを提案します。サブグラフ間の類似性を特徴づける手段を提供し、sub2vecの理論的分析を行い、局所近接性と呼ばれる特性が保たれることを示します。さらに、sub2vecをコミュニティ検出などのネットワークマイニングタスクに活用することによりその有用性を強調します。実験結果から、sub2vecは最先端手法やノード埋め込み手法に対して有意な改善が得られることを示しています。特に、sub2vecはサブグラフの豊富な特徴語彙を生成するアプローチを提供し、表現と推論を支援します。