SUREL+: الانتقال من المشي إلى المجموعات لتعلم تمثيل الرسوم البيانية القائمة على المخططات الجزئية القابلة للتوسع

لقد ظهرت التعلم القائم على التمثيل الرسومي الفرعي (SGRL) مؤخرًا كأداة قوية في العديد من مهام التنبؤ على الرسوم البيانية بفضل مزاياها في التعبير النموذجي وقدرة التعميم. تواجه معظم النماذج السابقة لـ SGRL تحديات حسابية مرتبطة بالتكلفة العالية لاستخراج الرسوم الفرعية لكل استعلام تدريب أو اختبار. في الآونة الأخيرة، تم اقتراح SUREL لتسريع عملية SGRL، حيث يتم عينة المشي العشوائي خارج الوقت (offline)، ثم تُدمج هذه المشي في الوقت الفعلي (online) كتمثيل بديل للرسم الفرعي في عملية التمثيل. وبفضل قابلية إعادة استخدام المشي العشوائي عبر استعلامات مختلفة، حقق SUREL أداءً متقدمًا على مستوى التوسعية والدقة التنبؤية. ومع ذلك، لا يزال SUREL يعاني من عبء حسابي عالٍ ناتج عن تكرار العقد في المشي العشوائي. في هذا العمل، نقترح إطارًا جديدًا يُسمى SUREL+، الذي يُعدّل SUREL من خلال استخدام مجموعات العقد بدلًا من المشي لتمثيل الرسوم الفرعية. يُزيل هذا التمثيل القائم على المجموعات العقد المتكررة بشكل تلقائي، لكنه قد يكون غير منتظم من حيث الحجم. لمعالجة هذه المشكلة، صممنا هيكل بيانات نادرًا مخصصًا لتخزين الوصول الفعّال لمجموعات العقد، وقمنا بتوفير عملية خاصة لدمجها في مجموعات متوازية. يُعد SUREL+ مُدمجًا (modularized) لدعم أنواع متعددة من مُولّدات المجموعات، والسمات الهيكلية، ومشغلات الشبكات العصبية، بهدف تعويض فقدان المعلومات الهيكلية الناتجة عن التقليل من المشي إلى مجموعات. أجرينا تجارب واسعة لتأكيد فعالية SUREL+ في مهام التنبؤ المتعلقة بالروابط، وأنواع العلاقات، وأنماط أعلى من الدرجة. حقق SUREL+ تسريعًا يصل إلى 3-11 مرة مقارنة بـ SUREL مع الحفاظ على أداء تنبؤي مماثل أو حتى أفضل؛ مقارنةً بالأساليب الأساسية الأخرى لـ SGRL، حقق SUREL+ تسريعًا يقارب 20 مرة، مع تحسين ملحوظ في دقة التنبؤ.