معيار الرسم البياني للمسافة الطويلة

الشبكات العصبية الرسومية (GNNs) القائمة على منهجية تمرير الرسائل (MP) تتبادل عادةً المعلومات بين الجيران المباشرين (1-hop neighbors) لبناء تمثيلات العقد في كل طبقة. وبشكل نظري، لا تمتلك هذه الشبكات القدرة على التقاط التفاعلات على مدى بعيد (LRI) التي قد تكون مطلوبة أو ضرورية لتعلم مهمة معينة على الرسوم البيانية. في الآونة الأخيرة، شهدت تطورًا متزايدًا في تطوير أساليب تعتمد على مُحَوِّلات (Transformers) للرسوم البيانية، والتي تأخذ بعين الاعتبار الاتصال الكامل بين العقد، بما يتجاوز البنية النادرة الأصلية، مما يمكّن من نمذجة التفاعلات على مدى بعيد. ومع ذلك، فإن الشبكات GNN القائمة على تمرير الرسائل (MP-GNNs) التي تعتمد فقط على تمرير الرسائل بين الجيران المباشرين غالبًا ما تُظهر أداءً أفضل في العديد من معايير الرسوم البيانية الحالية عند دمجها مع تمثيلات موضعية (positional feature representations) وأساليب أخرى مبتكرة، مما يحد من الفائدة المُدركة وتصنيف الهياكل المشابهة للمحولات. في هذا العمل، نقدم معيار الرسوم البيانية للتفاعل على مدى بعيد (LRGB) المكوَّن من 5 مجموعات بيانات لتعلم الرسوم البيانية: PascalVOC-SP، COCO-SP، PCQM-Contact، Peptides-func، وPeptides-struct، والتي يُعد من الممكن أن تتطلب استنتاجات تتعلق بالتفاعلات على مدى بعيد لتحقيق أداء قوي في المهام المحددة. قمنا بقياس الأداء للشبكات GNN الأساسية والشبكات الرسومية المبنية على المحولات (Graph Transformer) للتحقق من أن النماذج التي تُمكّن من التقاط الاعتماديات على مدى بعيد تُظهر أداءً أفضل بشكل ملحوظ في هذه المهام. وبالتالي، تُعد هذه المجموعات بيانات مناسبة لتقييم واستكشاف هياكل MP-GNNs والمحولات الرسومية التي تهدف إلى التقاط التفاعلات على مدى بعيد.