HyperAIHyperAI
vor 11 Tagen

OGB-LSC: Eine großskalige Herausforderung für maschinelles Lernen auf Graphen

Weihua Hu, Matthias Fey, Hongyu Ren, Maho Nakata, Yuxiao Dong, Jure Leskovec
OGB-LSC: Eine großskalige Herausforderung für maschinelles Lernen auf Graphen
Abstract

Die effektive und effiziente Anwendung von maschinellem Lernen (ML) auf großskalige Graphendaten (z. B. Graphen mit mehreren Milliarden Kanten) kann erhebliche Auswirkungen sowohl auf industrielle als auch auf wissenschaftliche Anwendungen haben. Bisher sind Fortschritte im Bereich des großskaligen Graphen-ML jedoch weitgehend durch das Fehlen eines geeigneten öffentlichen Benchmarks eingeschränkt. Hier stellen wir den OGB Large-Scale Challenge (OGB-LSC) vor, eine Sammlung von drei realen Datensätzen, die die Weiterentwicklung des großskaligen Graphen-ML fördern sollen. Die OGB-LSC-Datensätze sind um Größenordnungen größer als bisher verfügbare, decken drei zentrale Aufgaben des Graphen-Lernens ab – Link-Prädiktion, Graphen-Regression und Knoten-Klassifikation. Zudem stellen wir spezifische Baseline-Experimente bereit, bei denen ausdrucksstarke Graphen-ML-Modelle auf die umfangreichen Datensätze skaliert werden. Wir zeigen, dass ausdrucksstarke Modelle einfache, skalierbare Baselines erheblich übertrumpfen, was ein erhebliches Verbesserungspotenzial für gezielte Forschungsanstrengungen im Bereich des großskaligen Graphen-ML aufzeigt. Darüber hinaus wurden die OGB-LSC-Datensätze im Rahmen des ACM KDD Cup 2021 eingesetzt und zogen weltweit über 500 Team-Registrierungen an. In diesem Wettbewerb wurden durch eine Vielzahl innovativer Techniken erhebliche Leistungsverbesserungen erzielt. Wir fassen die häufig verwendeten Techniken der Siegerlösungen zusammen und heben die derzeitigen Best Practices im Bereich des großskaligen Graphen-ML hervor. Abschließend beschreiben wir, wie wir die Datensätze nach dem KDD Cup aktualisiert haben, um die Forschung weiter zu fördern. Die OGB-LSC-Datensätze, der Baseline-Code sowie alle Informationen zum KDD Cup sind unter https://ogb.stanford.edu/docs/lsc/ verfügbar.

OGB-LSC: Eine großskalige Herausforderung für maschinelles Lernen auf Graphen | Neueste Forschungsarbeiten | HyperAI