graph2vec: Lernen von verteilten Darstellungen von Graphen

Kürzliche Arbeiten im Bereich des Repräsentationslernens für graphenstrukturierte Daten konzentrieren sich hauptsächlich auf das Lernen verteilter Repräsentationen von Graphunterstrukturen wie Knoten und Teilgraphen. Viele Graphanalyseaufgaben, wie die Klassifikation und Clustering von Graphen, erfordern jedoch die Darstellung ganzer Graphen als fixlängige Merkmalsvektoren. Während die genannten Ansätze natürlicherweise nicht in der Lage sind, solche Repräsentationen zu lernen, bleiben Graphkerne die effektivste Methode, um sie zu erhalten. Allerdings verwenden diese Graphkerne handgefertigte Merkmale (z.B. kürzeste Pfade, Graphlets usw.), wodurch sie durch Probleme wie eine schlechte Generalisierung beeinträchtigt werden. Um diese Einschränkung zu überwinden, schlagen wir in dieser Arbeit ein neuronales Einbettungsframework namens graph2vec vor, um datengesteuerte verteilte Repräsentationen von beliebig großen Graphen zu lernen. Die Einbettungen von graph2vec werden auf unsupervisierte Weise gelernt und sind aufgabenunabhängig. Sie können daher für jede nachgelagerte Aufgabe wie die Klassifikation und Clustering von Graphen oder sogar als Startpunkt für supervisierte Repräsentationslernansätze verwendet werden. Unsere Experimente mit mehreren Benchmark- und großen realweltlichen Datensätzen zeigen, dass graph2vec signifikante Verbesserungen der Klassifikations- und Clusteringgenauigkeit gegenüber Ansätzen zum Lernen von Unterstrukturrepräsentationen erreicht und mit den besten aktuellen Graphkernen konkurrieren kann.