graph2vec: تعلم التمثيلات الموزعة للرسوم البيانية

الدراسات الحديثة في تعلم التمثيل للبيانات ذات الهيكل الرسومي تركز بشكل أساسي على تعلم التمثيلات الموزعة لجزء من الرسوم البيانية مثل العقد والرسوم الفرعية. ومع ذلك، فإن العديد من مهام تحليل الرسوم البيانية مثل تصنيف الرسوم وتجزئتها تتطلب تمثيل الرسوم البيانية بأكملها كمتجهات ميزات ذات طول ثابت. بينما لا تكون الأساليب المذكورة أعلاه مجهزة بشكل طبيعي لتعلم مثل هذه التمثيلات، تظل النواة الرسمية هي الطريقة الأكثر فعالية للحصول عليها. ومع ذلك، فإن هذه النوى الرسمية تستند إلى خصائص يدوية الصنع (مثل المسارات الأقصر، والرسوم الجزئية، إلخ) وبالتالي تعاني من مشاكل مثل ضعف التعميم. لمعالجة هذا القيد، نقترح في هذا العمل إطارًا عصبيًا للغمر يُدعى graph2vec لتعلم تمثيلات بيانات موزعة للرسوم البيانية ذات الحجم العشوائي. يتم تعلم غمرات graph2vec بطريقة غير مراقبة وهي مستقلة عن المهمة. لذلك يمكن استخدامها لأي مهمة لاحقة مثل تصنيف الرسوم البيانية وتجزئتها وحتى لتغذية أساليب تعلم التمثيل المراقب. أظهرت تجاربنا على عدة قواعد بيانات معيارية وكبيرة الحجم من العالم الحقيقي أن graph2vec حققت تحسينات كبيرة في دقة التصنيف والتجزئة مقارنة بأساليب تعلم تمثيل الجزء الفرعي وأداءها تنافسي مع أفضل النوى الرسمية المعاصرة.