Verteilte Darstellung von Untergraphen

Netzwerkeinbettungen sind in den letzten Jahren sehr populär geworden, um effektive Merkmalsrepräsentationen von Netzwerken zu erlernen. Angeregt durch die jüngsten Erfolge von Einbettungen im Bereich der natürlichen Sprachverarbeitung, haben Forscher versucht, Netzwerkeinbettungen zu finden, um maschinelle Lernalgorithmen für Mining-Aufgaben wie Knotenklassifizierung und Kantenprognose zu nutzen. Dennoch konzentriert sich die Mehrheit der Arbeiten auf das Finden verteilter Repräsentationen von Knoten, die für Aufgaben wie Community-Erkennung, die intuitiv von Untergraphen abhängig sind, inherent ungeeignet sind.In diesem Beitrag stellen wir sub2vec vor, einen unüberwachten und skalierbaren Algorithmus zur Lernmerkmalsrepräsentation beliebiger Untergraphen. Wir bieten Methoden zur Charakterisierung von Ähnlichkeiten zwischen Untergraphen und führen eine theoretische Analyse von sub2vec durch, wobei wir zeigen, dass es die sogenannte lokale Nähe beibehält. Zudem unterstreichen wir die Nutzbarkeit von sub2vec durch dessen Anwendung auf Netzwerkmining-Aufgaben wie Community-Erkennung. Wir demonstrieren, dass sub2vec erhebliche Verbesserungen gegenüber den aktuellen Methoden und Knoteneinbettungsverfahren bietet. Insbesondere bietet sub2vec einen Ansatz zur Generierung eines reichhaltigeren Vokabulars an Merkmalen von Untergraphen, um Repräsentation und Schließfolgerung zu unterstützen.