UniG-Encoder: Ein universeller Merkmalsencoder für die Knotenklassifizierung in Graphen und Hypergraphen

Die Forschung zu Graph- und Hypergraph-Darstellungslernverfahren hat in den letzten Jahren zunehmendes Interesse aus verschiedenen Disziplinen hervorgerufen. Trotz der beachtlichen Leistungsfähigkeit und der vielfältigen Anwendungen von Graph Neural Networks (GNNs), Hypergraph Neural Networks (HGNNs) sowie deren gut gestalteten Varianten auf gängigen Benchmark-Graphen und -Hypergraphen werden diese oft von einem einfachen Multi-Layer Perceptron (MLP) übertroffen. Diese Beobachtung motiviert eine Neubewertung des aktuellen Designparadigmas von GNNs und HGNNs und wirft Herausforderungen hinsichtlich der effektiven Extraktion von Graph-Features auf. In dieser Arbeit wird ein universeller Feature-Encoder für die Darstellungslernung sowohl von Graphen als auch von Hypergraphen vorgestellt, der als UniG-Encoder bezeichnet wird. Die Architektur beginnt mit einer Vorwärts-Transformation der topologischen Beziehungen zwischen verbundenen Knoten in Kanten- oder Hyperkanten-Features mittels einer normalisierten Projektionsmatrix. Die resultierenden Kanten-/Hyperkanten-Features werden zusammen mit den ursprünglichen Knoten-Features in ein neuronales Netzwerk eingespeist. Die codierten Knoten-Embeddings werden anschließend durch eine Rücktransformation gewonnen, die durch die Transponierte der Projektionsmatrix beschrieben wird und aus dem Netzwerk-Ausgang hervorgeht. Diese Embeddings können anschließend für Aufgaben wie Knotenklassifikation verwendet werden. Im Gegensatz zu traditionellen, spektralbasierten und/oder Nachrichtenübertragungsansätzen nutzt die vorgeschlagene Architektur auf effiziente und einheitliche Weise sowohl Knoten-Features als auch die Topologie von Graphen und Hypergraphen simultan und umfassend – und zwar sowohl für heterophile als auch für homophile Graphen. Die entworfene Projektionsmatrix, die die Graph-Features kodiert, ist intuitiv und interpretierbar. Umfassende Experimente zeigen die überlegene Leistung des vorgeschlagenen Ansatzes auf zwölf repräsentativen Hypergraph-Datensätzen sowie sechs realen Graph-Datensätzen im Vergleich zu aktuellen State-of-the-Art-Methoden. Die Implementierung ist öffentlich zugänglich unter https://github.com/MinhZou/UniG-Encoder.