HyperAIHyperAI
منذ 16 أيام

مُعَرِّف الرسم البياني المفتوح: مجموعات بيانات للتعلم الآلي على الرسوم البيانية

Weihua Hu, Matthias Fey, Marinka Zitnik, Yuxiao Dong, Hongyu Ren, Bowen Liu, Michele Catasta, Jure Leskovec
مُعَرِّف الرسم البياني المفتوح: مجموعات بيانات للتعلم الآلي على الرسوم البيانية
الملخص

نقدّم معيار الرسم البياني المفتوح (OGB)، وهو مجموعة متنوعة من مجموعات البيانات القياسية الصعبة والواقعية، بهدف تعزيز أبحاث تعلم الآلة على الرسوم البيانية (ML) القابلة للتوسع، والموثوقة، والقابلة للتكرار. تتميز مجموعات بيانات OGB بحجمها الكبير، وتشمل مهام متعددة مهمة في تعلم الآلة على الرسوم البيانية، وتغطي طيفًا واسعًا من المجالات، بدءًا من الشبكات الاجتماعية والشبكات المعلوماتية، وصولاً إلى الشبكات الحيوية، والرسوم البيانية الجزيئية، وأشجار التحليل النحوي للبرمجة (ASTs)، والرسوم المعرفية. لكل مجموعة بيانات، نوفر بروتوكول تقييم موحدًا يستخدم تقسيمات بيانات محددة تطبيقيًا ذات معنى، ومقاييس تقييم مناسبة. بالإضافة إلى بناء مجموعات البيانات، نقوم أيضًا بتجارب معيارية شاملة لكل مجموعة بيانات. تشير نتائج تجاربنا إلى أن مجموعات بيانات OGB تفرض تحديات كبيرة في قابلية التوسع للرسوم البيانية الكبيرة، والتعميم خارج التوزيع (out-of-distribution) تحت تقسيمات بيانات واقعية، مما يشير إلى فرص واعدة لأبحاث مستقبلية. وأخيرًا، يوفر OGB مسارًا تلقائيًا من البداية إلى النهاية لتعلم الآلة على الرسوم البيانية، مما يبسط ويوحّد عملية تحميل البيانات، وإعداد التجارب، وتقييم النماذج. وسيتم تحديث OGB بانتظام، ونرحب بمساهمات المجتمع. تتوفر مجموعات بيانات OGB، إلى جانب أدوات تحميل البيانات، ونصوص التقييم، والكود الأساسي، وقوائم الترتيب، بشكل عام على الموقع الإلكتروني: https://ogb.stanford.edu.

مُعَرِّف الرسم البياني المفتوح: مجموعات بيانات للتعلم الآلي على الرسوم البيانية | أحدث الأوراق البحثية | HyperAI