HyperAIHyperAI
منذ 11 أيام

OGB-LSC: تحدي على نطاق واسع لتعلم الآلة على الرسوم البيانية

Weihua Hu, Matthias Fey, Hongyu Ren, Maho Nakata, Yuxiao Dong, Jure Leskovec
OGB-LSC: تحدي على نطاق واسع لتعلم الآلة على الرسوم البيانية
الملخص

تمكين التعلم الآلي الفعّال والكفاءة على بيانات الرسوم البيانية الضخمة (مثل الرسومات التي تحتوي على مليارات الحواف) يمكن أن يكون له أثر كبير على التطبيقات الصناعية والعلمية. ومع ذلك، فإن الجهود الحالية لتطوير التعلم الآلي على الرسومات الضخمة محدودة إلى حد كبير بسبب غياب معيار عام مناسب. في هذا العمل، نقدّم تحدي OGB للقياسات الكبيرة (OGB-LSC)، وهو مجموعة من ثلاث قواعد بيانات واقعية تهدف إلى تعزيز التقدم في التعلم الآلي على الرسومات الضخمة. تمثل مجموعات بيانات OGB-LSC حجماً أكبر بمئات المرات مقارنةً بالبيانات الموجودة مسبقاً، وتشمل ثلاث مهام أساسية في التعلم على الرسومات: توقع الروابط، الانحدار على الرسومات، والتصنيف على العقد. علاوةً على ذلك، نقدّم تجارب أساسية مخصصة، ونُطبّق نماذج قوية للتعلم الآلي على الرسومات على هذه المجموعات الضخمة. ونُظهر أن النماذج التعبيرية تتفوّق بشكل كبير على النماذج البسيطة القابلة للتوسع، مما يشير إلى وجود فرصة لجهود مخصصة لتحسين التعلم الآلي على الرسومات على نطاق واسع. وبالإضافة إلى ذلك، تم نشر مجموعات بيانات OGB-LSC في مسابقة ACM KDD Cup 2021، حيث جذبت أكثر من 500 فريق من جميع أنحاء العالم، وتم تحقيق تحسينات كبيرة في الأداء باستخدام تقنيات مبتكرة متنوعة. ونلخّص التقنيات الشائعة المستخدمة في الحلول الفائزة، ونُبرز أفضل الممارسات الحالية في التعلم الآلي على الرسومات الضخمة. وأخيراً، نصف كيف قمنا بتحديث مجموعات البيانات بعد مسابقة KDD Cup لتعزيز التقدم في الأبحاث بشكل أكبر. تُتاح مجموعات بيانات OGB-LSC، وشفرة النماذج الأساسية، وجميع المعلومات المتعلقة بمسابقة KDD Cup عبر الرابط التالي: https://ogb.stanford.edu/docs/lsc/.

OGB-LSC: تحدي على نطاق واسع لتعلم الآلة على الرسوم البيانية | أحدث الأوراق البحثية | HyperAI