DAGCN: شبكات الرسم البياني التوافقي ذات الانتباه المزدوج

شبكات التجميع الرسومية (GCNs) أصبحت مؤخراً من أدوات أكثر قوة لمهام تحليل الرسوم في العديد من التطبيقات، بدءًا من الشبكات الاجتماعية ومعالجة اللغة الطبيعية وصولاً إلى المعلومات الحيوية والمعلومات الكيميائية، بفضل قدرتها على التقاط العلاقات المعقدة بين المفاهيم. في الوقت الحالي، تعتمد الغالبية العظمى من شبكات التجميع الرسومية على إطار عمل تجميع الجوار لتعلم متجه مستمر ومكثف، ثم أداء عملية تجميع (pooling) لتعميم تمثيل الرسم البياني لل مهمة التصنيف. تعاني هذه النهجين من عيبين رئيسيين في مهمة تصنيف الرسوم البيانية: (1) عند استخدام أكبر بنية فرعية فقط (جوار $k$-خطوة) للتجميع الجواري، يتم فقدان كمية كبيرة من المعلومات المبكرة خلال خطوة التجميع الرسومي؛ (2) استخدام عمليات التجميع البسيطة مثل المتوسط/المجموع أو التجميع الأقصى، مما يؤدي إلى فقدان خصائص كل عقدة والطوبولوجيا بين العقد. في هذا البحث، نقترح إطار عمل جديد يُدعى شبكات التجميع الرسومية ذات الانتباه المزدوج (DAGCN) لمعالجة هذه المشكلات. يقوم DAGCN بتعلم أهمية الجيران بشكل آلي عند الخطوات المختلفة باستخدام طبقة تجميع رسومي جديدة ذات انتباه، ثم يستخدم مكون الانتباه الثاني وهو طبقة تجميع ذات انتباه ذاتي لتعميم تمثيل الرسم البياني من جوانب مختلفة للمصفوفة المضمنة للرسم البياني. يتم تدريب شبكة الانتباه المزدوجة بطريقة شاملة لتنفيذ مهمة تصنيف الرسوم البيانية. نقارن نموذجنا مع أفضل نواة رسومية وأساليب التعلم العميق الأخرى. تظهر النتائج التجريبية أن إطار عملنا ليس فقط يتفوق على الأساليب الأساسية الأخرى بل يحقق أيضاً معدل تقارب أفضل.