Command Palette
Search for a command to run...
Großes Lernen auf nicht-homophilen Graphen: Neue Benchmarks und starke einfache Methoden
Großes Lernen auf nicht-homophilen Graphen: Neue Benchmarks und starke einfache Methoden
Derek Lim; Felix Hohne; Xiuyu Li; Sijia Linda Huang; Vaishnavi Gupta; Omkar Bhalerao; Ser-Nam Lim
Zusammenfassung
Viele weit verbreitete Datensätze für maschinelles Lernen auf Graphen waren bisher im Allgemeinen homophil, bei denen Knoten mit ähnlichen Etiketten miteinander verbunden sind. Kürzlich wurden neue Graph-Neuronale Netze (GNNs) entwickelt, die den Bereich der Homophilie überschreiten; ihre Bewertung wurde jedoch oft an kleinen Graphen durchgeführt, die nur begrenzte Anwendungsbereiche abdecken. Wir sammeln und stellen vielfältige nicht-homophile Datensätze aus verschiedenen Anwendungsbereichen vor, die bis zu 384-mal mehr Knoten und 1398-mal mehr Kanten als frühere Datensätze aufweisen. Darüber hinaus zeigen wir, dass bestehende skalierbare Methoden des maschinellen Lernens auf Graphen und Minibatch-Techniken zu Leistungsverlusten bei diesen nicht-homophilen Datensätzen führen, was die Notwendigkeit weiterer Arbeiten an skalierbaren nicht-homophilen Methoden unterstreicht. Um diese Bedenken zu adressieren, führen wir LINKX ein – eine starke und einfache Methode, die eine direkte Minibatch-Bildung und -Inferenz ermöglicht. Ausführliche experimentelle Ergebnisse mit repräsentativen einfachen Methoden und GNNs über unsere vorgeschlagenen Datensätze zeigen, dass LINKX den aktuellen Stand der Technik in Bezug auf das Lernen auf nicht-homophilen Graphen erreicht. Unsere Codes und Daten sind unter https://github.com/CUAI/Non-Homophily-Large-Scale verfügbar.