metapath2vec: Skalierbare Darstellungslernverfahren für heterogene Netzwerke
Wir untersuchen das Problem der Repräsentationslernen in heterogenen Netzwerken. Die besonderen Herausforderungen ergeben sich aus der Existenz mehrerer Knotentypen und Linktypen, was die Anwendbarkeit herkömmlicher Netzwerkeinbettungstechniken einschränkt. Wir entwickeln zwei skalierbare Modelle für das Repräsentationslernen, nämlich metapath2vec und metapath2vec++. Das metapath2vec-Modell formalisiert meta-path-basierte Zufallswanderungen, um die heterogene Nachbarschaft eines Knotens zu konstruieren, und nutzt anschließend ein heterogenes Skip-gram-Modell zur Knoteneinbettung. Das metapath2vec++-Modell erweitert diese Fähigkeit und ermöglicht zudem die gleichzeitige Modellierung struktureller und semantischer Korrelationen in heterogenen Netzwerken. Umfassende Experimente zeigen, dass metapath2vec und metapath2vec++ nicht nur state-of-the-art-Einbettungsmodelle in verschiedenen Aufgaben des Mining heterogener Netzwerke – wie Knotenklassifikation, Clustering und Ähnlichkeitssuche – übertrifft, sondern auch die strukturellen und semantischen Beziehungen zwischen unterschiedlichen Netzwerkobjekten erkennen kann.