HyperAIHyperAI
vor 11 Tagen

Open Graph Benchmark: Datensätze für maschinelles Lernen auf Graphen

Weihua Hu, Matthias Fey, Marinka Zitnik, Yuxiao Dong, Hongyu Ren, Bowen Liu, Michele Catasta, Jure Leskovec
Open Graph Benchmark: Datensätze für maschinelles Lernen auf Graphen
Abstract

Wir präsentieren den Open Graph Benchmark (OGB), eine vielfältige Sammlung herausfordernder und realistischer Benchmark-Datensätze, um skalierbare, robuste und reproduzierbare Forschung im Bereich des Graphen-Maschinellen Lernens (ML) zu fördern. Die OGB-Datensätze sind großskalig, umfassen mehrere wichtige Aufgaben im Bereich des graphenbasierten ML und decken eine breite Palette von Anwendungsbereichen ab – von sozialen und informationsbasierten Netzwerken über biologische Netzwerke, Moleküldiagramme, Quellcode-ASTs (Abstract Syntax Trees) bis hin zu Wissensgraphen. Für jeden Datensatz stellen wir eine einheitliche Evaluationsprotokoll bereit, das sinnvolle, anwendungsbezogene Datensplits und geeignete Bewertungsmetriken verwendet. Neben der Erstellung der Datensätze führen wir zudem umfangreiche Benchmark-Experimente für jeden Datensatz durch. Unsere Experimente zeigen, dass die OGB-Datensätze erhebliche Herausforderungen hinsichtlich Skalierbarkeit bei großen Graphen und Generalisierung außerhalb der Verteilung unter realistischen Datensplits darstellen, was bedeutende Forschungsmöglichkeiten für zukünftige Arbeiten eröffnet. Schließlich bietet OGB eine automatisierte End-to-End-Pipeline für graphenbasiertes ML, die den Prozess des Datenladens, der experimentellen Einrichtung und der Modellbewertung vereinfacht und standardisiert. OGB wird regelmäßig aktualisiert und begrüßt Beiträge aus der Forschungsgemeinschaft. Die OGB-Datensätze sowie Datensampler, Evaluierungsskripte, Baseline-Code und Leaderboards sind öffentlich unter https://ogb.stanford.edu verfügbar.

Open Graph Benchmark: Datensätze für maschinelles Lernen auf Graphen | Neueste Forschungsarbeiten | HyperAI