HyperAIHyperAI
vor 8 Tagen

GEMSEC: Graph-Embedding mit selbstständiger Clustering

{Ryan Davies, Benedek Rozemberczki, Charles Sutton, Rik Sarkar}
GEMSEC: Graph-Embedding mit selbstständiger Clustering
Abstract

Moderne Graph-Embedding-Verfahren können effizient Merkmale von Knoten aus Graphen mit Millionen von Knoten extrahieren. Diese Merkmale werden anschließend als Eingaben für nachfolgende prädiktive Aufgaben verwendet. In diesem Paper stellen wir GEMSEC vor, einen Graph-Embedding-Algorithmus, der gleichzeitig eine Clustering der Knoten und die Berechnung ihrer Merkmale lernt. Das Verfahren platziert die Knoten in einem abstrakten Merkmalsraum, in dem die Knotenmerkmale die negative Log-Likelihood der Erhaltung stichprobenbasierter Nachbarschaften minimieren, während die Knoten in einer festen Anzahl von Gruppen in diesem Raum gruppiert werden. GEMSEC ist eine allgemeine Erweiterung früherer Arbeiten im Bereich, da es eine Erweiterung des zentralen Optimierungsproblems sequenzbasierter Graph-Embedding-Verfahren darstellt und unabhängig von der Strategie zur Nachbarschaftsstichprobenerzeugung ist. Wir zeigen, dass GEMSEC hochwertige Cluster in realen sozialen Netzwerken extrahiert und wettbewerbsfähig mit anderen Algorithmen zur Gemeinschaftserkennung ist. Zudem belegen wir, dass die Clustering-Beschränkung einen positiven Einfluss auf die Qualität der Repräsentation hat, und dass unser Verfahren in robuster und skalierbarer Weise Graphen gleichzeitig einbettet und clustert.