تحسين الشبكات العصبية الرسومية من خلال تصميم معماري بسيط

أصبحت الشبكات العصبية الرسومية أداة مفيدة لتعلم البيانات من خلال تطبيق قيود إضافية تعتمد على البنية الرسومية. غالبًا ما تُنشأ هذه الرسوم البيانية بناءً على افتراضات حول العلاقات الجوهرية بين الكيانات. في السنوات الأخيرة، شهدت تصميمات البنية المعمارية تطورات كبيرة، مما دفع بتحسن الأداء في مهام التنبؤ المختلفة. بشكل عام، تدمج هذه المعمارية العصبية بين عمق الطبقات وخطوات تجميع ميزات العقد. وهذا يُعدّ تحديًا في تحليل أهمية الميزات عند مختلف المسافات (الهوبات) والقدرة التعبيرية للطبقات العصبية. نظرًا لأن مجموعات البيانات الرسومية المختلفة تُظهر مستويات متفاوتة من التماثل (الهوموفيليا) والاختلاف (الهتروفيليا) في توزيع الميزات وملصقات الفئات، يصبح من الضروري فهم أي الميزات تُعدّ مهمة لمهام التنبؤ دون أي معلومات مسبقة. في هذا العمل، نفصل بين خطوة تجميع ميزات العقد وعمق الشبكة العصبية الرسومية، ونُقدّم عدة استراتيجيات تصميم رئيسية للشبكات العصبية الرسومية. وبشكل أكثر تحديدًا، نقترح استخدام دالة سوфтماكس كعامل تنظيم (Regularizer) و"مُحدّد لين" (Soft-Selector) للميزات المستخلصة من الجيران على مسافات مختلفة (هوبات مختلفة)، بالإضافة إلى "معادلة التطبيع حسب الهوب" (Hop-Normalization) على طبقات الشبكة العصبية الرسومية. وبدمج هذه التقنيات، نقدّم نموذجًا بسيطًا وطويلًا جدًا (Shallow)، يُسمى "الشبكة العصبية الرسومية لاختيار الميزات" (FSGNN)، ونُظهر تجريبيًا أن النموذج المقترح يتفوق على نماذج GNN الرائدة الأخرى، ويحقق تحسنًا يصل إلى 64% في الدقة في مهام تصنيف العقد. علاوةً على ذلك، يُتيح تحليل المعاملات المُتعلّمة للتحديد اللين (Soft-selection) طريقة بسيطة لدراسة أهمية الميزات في مهام التنبؤ. وأخيرًا، نُظهر من خلال التجارب أن النموذج قابل للتوسع بفعالية على الرسوم البيانية الكبيرة التي تحتوي على ملايين العقد وعشرات المليارات من الحواف.