
要約
ネットワークのノードとエッジに対する予測タスクには、学習アルゴリズムで使用される特徴量のエンジニアリングに細心の注意が必要です。表現学習という広い分野での最近の研究により、特徴量自体を学習することで予測を自動化するという点で大きな進展が見られています。しかし、現在の特徴量学習アプローチは、ネットワークで観察される接続パターンの多様性を捉えるのに十分な表現力を持っていません。本稿では、ネットワーク内のノードの連続的な特徴量表現を学習するためのアルゴリズムフレームワークであるnode2vecを提案します。node2vecでは、ノード間のネットワーク近傍を保つ可能性が最大となるように、ノードから低次元空間へのマッピングを学習します。私たちは柔軟な概念としてノードのネットワーク近傍を定義し、多様な近傍を効率的に探索するバイアス付きランダムウォーク手続きを設計しました。当アルゴリズムは、ネットワーク近傍に関する硬直的な概念に基づく先行研究を一般化しており、近傍探索における追加された柔軟性が豊かな表現を学習する鍵であると主張しています。私たちは、実世界の複数ドメインから得られたいくつかの実際のネットワークにおいて、マルチラベル分類やリンク予測における既存の最先端技術よりもnode2vecが優れていることを示しています。全体として、私たちの研究は複雑なネットワークにおいて効率的に最新かつタスクに依存しない表現を学習する新しい方法を提示しています。