metapath2vec : Apprentissage représentation scalable pour les réseaux hétérogènes
Nous étudions le problème de l’apprentissage de représentations dans les réseaux hétérogènes. Ses défis particuliers proviennent de la présence de plusieurs types de nœuds et d’arêtes, ce qui limite la faisabilité des techniques classiques d’embedding de réseaux. Nous proposons deux modèles d’apprentissage de représentations évolutifs, appelés metapath2vec et metapath2vec++. Le modèle metapath2vec formalise les marches aléatoires basées sur les métapaths afin de construire le voisinage hétérogène d’un nœud, puis utilise un modèle de saut hétérogène (heterogeneous skip-gram) pour générer les embeddings des nœuds. Le modèle metapath2vec++ permet quant à lui une modélisation simultanée des corrélations structurelles et sémantiques au sein des réseaux hétérogènes. Des expériences étendues montrent que metapath2vec et metapath2vec++ surpassent non seulement les modèles d’embedding les plus avancés dans diverses tâches d’exploration de réseaux hétérogènes, telles que la classification de nœuds, le regroupement (clustering) et la recherche de similarité, mais permettent également de distinguer les corrélations structurelles et sémantiques entre les différents objets du réseau.