Strukturelle Deep Network Embedding

Netzwerk-Embedding ist eine wichtige Methode zur Lernung niederdimensionaler Repräsentationen von Knoten in Netzwerken mit dem Ziel, die Netzwerkstruktur effektiv zu erfassen und zu bewahren. Fast alle bestehenden Ansätze für Netzwerk-Embedding basieren auf flachen Modellen. Da die zugrundeliegende Netzwerkstruktur jedoch komplex ist, können flache Modelle die stark nichtlineare Struktur eines Netzwerks nicht ausreichend erfassen, was zu suboptimalen Netzwerkrepräsentationen führt. Daher stellt sich die Frage, wie man eine Methode finden kann, die in der Lage ist, die stark nichtlineare Netzwerkstruktur effektiv zu erfassen und gleichzeitig sowohl die globale als auch die lokale Struktur zu bewahren – ein offenes, jedoch von großer Bedeutung. Um dieses Problem zu lösen, schlagen wir in diesem Artikel eine Struktur-basierte tiefe Netzwerk-Embedding-Methode vor, namens SDNE (Structural Deep Network Embedding). Genauer gesagt, schlagen wir zunächst ein halbüberwachtes tiefes Modell vor, das mehrere Schichten nichtlinearer Funktionen enthält und somit in der Lage ist, die stark nichtlineare Netzwerkstruktur zu erfassen. Anschließend schlagen wir vor, die erste- und zweite-Ordnung-Nähe gemeinsam auszunutzen, um die Netzwerkstruktur zu bewahren. Die zweite-Ordnung-Nähe wird vom unüberwachten Teilkomponente genutzt, um die globale Netzwerkstruktur zu erfassen, während die erste-Ordnung-Nähe als überwachte Information im überwachten Teilkomponente dient, um die lokale Netzwerkstruktur zu bewahren. Durch die gemeinsame Optimierung beider Komponenten im halbüberwachten tiefen Modell kann unsere Methode sowohl die lokale als auch die globale Netzwerkstruktur effektiv bewahren und ist robust gegenüber spärlichen Netzwerken. Empirisch führen wir Experimente an fünf realen Netzwerken durch, darunter ein Sprachnetzwerk, ein Zitierungsnetzwerk und drei soziale Netzwerke. Die Ergebnisse zeigen, dass unsere Methode im Vergleich zu den Baseline-Verfahren die ursprüngliche Netzwerkstruktur signifikant besser rekonstruiert und in drei Anwendungen erhebliche Verbesserungen erzielt: mehrfachklassifizierende Klassifikation, Link-Vorhersage und Visualisierung.