مُشَكِّل الرسم البياني التمييزي التلقائي
بالنظر إلى الكثرة الهائلة للبيانات ذات البنية الرسومية في مختلف التطبيقات، أصبح تعلم تمثيلات الرسوم البيانية أداة حسابية فعالة للحصول على تمثيلات متجهية مفيدة للرسوم البيانية. غالبًا ما تعتمد الطرق التقليدية لـ "النواة الرسومية" (graph kernel) على الترددات، حيث يمثل كل بعد من متجه التمثيل المُتعلم تكرار نوع معين من البنية الفرعية. ومع ذلك، تواجه هذه الطرق تكاليف حسابية عالية نظرًا لاحتياجها لعدّ تكرار البنى الفرعية المحددة مسبقًا. كما أن تمثيلات المتجهات الناتجة تكون شديدة الندرة (sparsity)، مما يمنع استخدام المنتج الداخلي (inner product). علاوة على ذلك، لا توجد هذه التمثيلات في فضاء سلس، لأن قيمها تكون فقط أعداد صحيحة. تسعى الطرق الحديثة للحل لمواجهة هذه التحديات من خلال تغيير دوال النواة بدلاً من إنتاج تمثيلات متجهية أفضل، ولكنها تقتصر على إنتاج مصفوفات نواة للاستخدام في الطرق القائمة على النواة، ولا تتوافق مع الطرق التي تتطلب تمثيلات متجهية. وبقي تعلم تمثيلات متجهية سلسة وفعّالة للرسوم البيانية ذات الهياكل والأحجام المختلفة تحديًا كبيرًا. مستوحى من التطورات الحديثة في الترميز التلقائي العميق (deep autoencoders)، نستكشف في هذه الورقة القدرة على استخدام الترميز التلقائي في تعلم تمثيلات الرسوم البيانية. على عكس الفيديوهات أو الصور، فإن الرسوم البيانية غالبًا ما تكون ذات أحجام مختلفة، ولا يمكن تجهيزها مباشرة للترميز التلقائي. ولذلك، نقترح إطارًا جديدًا يُسمى "الترميز التلقائي الرسومي التمييزي" (Discriminative Graph Autoencoder, DGA)، لتعلم تمثيلات متجهية منخفضة الأبعاد للرسوم البيانية. يُفكّك الخوارزمية الرسوم البيانية الكبيرة إلى رسميات فرعية صغيرة، من خلالها يتم أخذ عينات من المعلومات الهيكلية. ويُنتج DGA تمثيلات متجهية سلسة وغنية بالمعلومات للرسوم البيانية بشكل فعّال، مع الحفاظ على المعلومات التمييزية وفقًا لملصقاتها. تم إجراء تجارب واسعة لتقييم أداء DGA، وقد أظهرت النتائج التجريبية كفاءة وفعالية DGA مقارنة بالطرق التقليدية والحديثة في مجموعة متنوعة من البيانات الحقيقية والتطبيقات، مثل...