Graph InfoClust: استغلال معلومات العقدة على مستوى التجميع لتعلم تمثيل الرسم البياني غير الخاضع للإشراف

التعلم غير المُراقب (أو التعلم الذاتي) لتمثيل الرسوم البيانية يُعد ضروريًا لتمكين مهام معالجة بيانات الرسوم البيانية المختلفة عندما تكون الإشراف الخارجي غير متوفر. والتحدي يكمن في ترميز المعلومات المتعلقة ببنية الرسم البياني والخصائص المرتبطة بالعُقد والحواف في فضاء منخفض الأبعاد. تعتمد معظم الطرق غير المُراقبة الحالية على تعزيز التمثيلات المشابهة بين العُقد التي تكون قريبة من حيث البنية التحتية (الهيكلية). ومؤخرًا، أُظهر أن الاستفادة من معلومات إضافية على مستوى الرسم البياني، مثل المعلومات المشتركة بين جميع العُقد، يُشجع التمثيلات على أخذ الخصائص العالمية للرسم البياني بعين الاعتبار، مما يُحسّن جودتها بشكل كبير. ومع ذلك، في معظم الرسوم البيانية، هناك هيكلية أكثر يمكن استخلاصها، مثل اتجاه العُقد للانتماء إلى (عدة) مجموعات (Clusters) تمثل عُقدًا ذات هيكلية متشابهة. مستوحى من هذه الملاحظة، نقترح طريقة لتعلم تمثيل الرسوم البيانية تُسمى Graph InfoClust (GIC)، والتي تسعى إلى استخلاص معلومات إضافية على مستوى المجموعة (Cluster-level). يتم حساب هذه المجموعات باستخدام طريقة K-means قابلة للتفاضل، وتُحسَّن بشكل مشترك من خلال تحسين المعلومات التبادلية بين العُقد التي تنتمي إلى نفس المجموعة. يؤدي هذا التحسين إلى تمثيلات للعُقد تُمثّل معلومات أكثر غنىً وتفاعلات بينية، مما يُحسّن جودتها. وأظهرت التجارب أن GIC تتفوّق على الطرق الحالية الأفضل في مهام متعددة (تصنيف العُقد، توقع الروابط، وتصنيف العُقد)، بتحسن متوسط يتراوح بين 0.9% و6.1% مقارنةً بأفضل منافس.