node2vec : Apprentissage de caractéristiques à grande échelle pour les réseaux

Les tâches de prédiction sur les nœuds et les arêtes dans les réseaux nécessitent des efforts minutieux pour élaborer les caractéristiques utilisées par les algorithmes d'apprentissage. Les recherches récentes dans le domaine plus large de l'apprentissage de représentation ont permis des progrès significatifs en automatisant la prédiction grâce à l'apprentissage direct des caractéristiques. Cependant, les approches actuelles d'apprentissage de caractéristiques ne sont pas suffisamment expressives pour capturer la diversité des modèles de connectivité observés dans les réseaux. Nous proposons ici node2vec, un cadre algorithmique pour apprendre des représentations continues de caractéristiques pour les nœuds dans les réseaux. Dans node2vec, nous apprenons une correspondance entre les nœuds et un espace de faible dimension de caractéristiques qui maximise la probabilité de préserver les voisinages réseau des nœuds. Nous définissons une notion flexible du voisinage réseau d'un nœud et concevons une procédure de marche aléatoire biaisée, qui explore efficacement des voisinages variés. Notre algorithme généralise les travaux antérieurs basés sur des notions rigides de voisinages réseau, et nous soutenons que la flexibilité supplémentaire dans l'exploration des voisinages est essentielle pour apprendre des représentations plus riches. Nous démontrons l'efficacité de node2vec par rapport aux techniques existantes d'avant-garde sur la classification multietiquettes et la prédiction de liens dans plusieurs réseaux du monde réel issus de domaines variés. Pris ensemble, nos travaux représentent une nouvelle approche permettant d'apprendre efficacement des représentations indépendantes des tâches et à l'état de l'art dans des réseaux complexes.