Binarisierte eindeutige Netzwerkeinbettung
Eine Implementierung des „Binarized Attributed Network Embedding“ (BANE). Attributierte Netzwerk-Embedding ermöglicht die gemeinsame Darstellungslernung von Knotenverbindungen und Knoteneigenschaften. Bestehende Modelle für attributierte Netzwerk-Embedding sind in kontinuierlichen euklidischen Räumen konzipiert, was oft Datenredundanz verursacht und Herausforderungen hinsichtlich Speicher- und Rechenkosten mit sich bringt. Um diesem Problem zu begegnen, präsentieren wir ein binarisches attributierte Netzwerk-Embedding-Modell (kurz: BANE), das binäre Knotendarstellungen lernt. Konkret definieren wir eine neue Weisfeiler-Lehman-Nähe-Matrix, um die Datenabhängigkeit zwischen Knotenverbindungen und Eigenschaften zu erfassen, indem Informationen über Knoteneigenschaften und Nachbarschaftsverbindungen schichtweise von benachbarten Knoten zu einem Zielknoten aggregiert werden. Auf Basis dieser Weisfeiler-Lehman-Nähe-Matrix formulieren wir eine neue Weisfeiler-Lehman-Matrixfaktorisierungslernfunktion unter der Einschränkung binärer Knotendarstellungen. Das Lernproblem stellt ein gemischt-ganzzahliges Optimierungsproblem dar, das mittels eines effizienten zyklischen Koordinatenabstiegs (CCD) gelöst wird. Experimente zur Knotenklassifikation und Link-Vorhersage auf realen Datensätzen zeigen, dass das vorgeschlagene BANE-Modell die derzeit besten Netzwerk-Embedding-Methoden übertrifft.