HyperAIHyperAI
vor 15 Tagen

Cleora: Ein einfaches, leistungsfähiges und skalierbares Schema für Graph-Embeddings

Barbara Rychalska, Piotr Bąbel, Konrad Gołuchowski, Andrzej Michałowski, Jacek Dąbrowski
Cleora: Ein einfaches, leistungsfähiges und skalierbares Schema für Graph-Embeddings
Abstract

Der Bereich der Graph-Embeddings wird derzeit maßgeblich durch kontrastive Lernmethoden dominiert, die eine explizite Ziel-Funktion erfordern sowie die Auswahl von positiven und negativen Beispielen vorsehen. Dies führt zu einem erheblichen konzeptuellen und rechnerischen Overhead. Einfache, klassische unüberwachte Ansätze wie Multidimensional Scaling (MDS) oder der Laplace-Eigenmap umgehen die Notwendigkeit aufwändiger Optimierung von Zielfunktionen und nutzen direkt die Geometrie der Daten aus. Leider sind sie aufgrund ihres Bedarfs an sehr kostenintensiven Operationen wie der Matrix-Eigenzerlegung nicht skalierbar auf große Graphen, wie sie in der heutigen digitalen Welt alltäglich sind. In diesem Artikel stellen wir Cleora vor – einen Algorithmus, der die Vorteile beider Welten vereint: Er ist sowohl unüberwacht als auch äußerst skalierbar. Wir zeigen, dass hochwertige Embeddings ohne den gängigen schrittweisen Lernrahmen mit Beispiel-Sampling erzeugt werden können. Ein intuitives Lernziel unseres Algorithmus besteht darin, dass ein Knoten seiner Nachbarschaft ähnlich sein sollte, ohne explizit getrennte Knoten voneinander zu schieben. Dieses Ziel wird durch iteratives gewichtetes Mitteln der Nachbarn-Embeddings erreicht, gefolgt von einer Normalisierung über die Dimensionen. Durch die Mittelung operiert der Algorithmus rasch im Embedding-Raum und erreicht in der Regel bereits nach wenigen Iterationen optimale Ergebnisse. Cleora läuft schneller als andere state-of-the-art CPU-Algorithmen und erzeugt Embeddings von konkurrenzfähiger Qualität, gemessen an nachgeschalteten Aufgaben wie Link-Prädiktion und Knoten-Klassifikation. Wir zeigen, dass Cleora eine Datenabstraktion lernt, die der von kontrastiven Methoden ähnelt, jedoch mit deutlich geringerem rechnerischem Aufwand. Wir stellen Cleora unter der MIT-Lizenz als Open Source zur Verfügung, wodurch kommerzielle Nutzung ermöglicht wird, unter https://github.com/Synerise/cleora.

Cleora: Ein einfaches, leistungsfähiges und skalierbares Schema für Graph-Embeddings | Neueste Forschungsarbeiten | HyperAI