فرضية الثلج المتنوعة: تدريب وتمكين الشبكات العصبية الرسومية لرسوم بيانية متنوعة

لقد أصبحت الشبكات العصبية الرسومية (GNNs) أدوات محورية لسلسلة من المهام التعليمية القائمة على الرسوم البيانية. ومن الملاحظ بشكل خاص أن معظم الهياكل الحالية للشبكات العصبية الرسومية تعمل ضمن افتراض التآزر (homophily)، سواء بشكل صريح أو ضمني. وعلى الرغم من أن هذا الافتراض الأساسي يُستخدم بشكل شائع، فإنه ليس معمولًا به بشكل شامل، مما قد يؤدي إلى عيوب محتملة في كفاءة التعلم. في هذا البحث، وبموجب ما يُعدّ أول مرة، نُحوّل المفهوم السائد المتمثل في "عقدة واحدة، مجال استقبال واحد" إلى البيئة الرسومية غير المتجانسة (heterophilic). وباستخدام مُنبّه تنبؤي بديل (proxy label predictor)، نُمكّن كل عقدة من امتلاك توزيع تنبؤ خفي، يُسهم في مساعدة العقد المرتبطة بها على تحديد ما إذا كانت ينبغي أن تجمع جيرانها المرتبطين بها. في النهاية، يمكن لكل عقدة أن تمتلك نمطًا وخطوة تجميع فريدة، تمامًا كما أن كل منشفة ثلجية فريدة وتمتلك خصائصها الخاصة. استنادًا إلى هذه الملاحظات، نقدّم بشكل مبتكر فرضية "المنشفة الثلجية غير المتجانسة" (Heterophily Snowflake Hypothesis)، ونقدّم حلًا فعّالًا لتوجيه وتمكين الأبحاث المتعلقة بالرسوم غير المتجانسة وبeyond. قمنا بتجارب شاملة تشمل: (1) النتائج الرئيسية على 10 رسومات مختلفة بنسب غير متجانسة متباينة عبر 10 نماذج أساسية (backbones)؛ (2) قابلية التوسع عبر نماذج GNN العميقة المختلفة (مثل SGC، JKNet، إلخ) على عدد كبير من الطبقات (2، 4، 6، 8، 16، 32 طبقة)؛ (3) مقارنة مع الفرضية التقليدية للمنشفة الثلجية؛ (4) مقارنة الكفاءة مع خوارزميات تقليم الرسومات الحالية. تُظهر نتائجنا أن إطار عملنا يعمل كعامل مرن لمهام متنوعة، ويمكن دمجه في مختلف أطر GNN، مما يعزز الأداء بشكل عميق ويقدّم منهجًا قابلاً للتفسير لاختيار العمق الأمثل للشبكة. يمكن الوصول إلى الكود المصدري من خلال الرابط التالي: \url{https://github.com/bingreeky/HeteroSnoH}.