استراتيجيات تدريب الرسومات العصبية المسبق

تتطلب العديد من تطبيقات التعلم الآلي أن يكون النموذج قادراً على إجراء تنبؤات دقيقة على أمثلة الاختبار التي تكون مختلفة توزيعياً عن أمثلة التدريب، بينما تكون العلامات الخاصة بالمهمة نادرة أثناء التدريب. وتعتبر طريقة فعالة لهذا التحدي هي تدريب النموذج مسبقاً على مهام ذات صلة حيث تكون البيانات وفيرة، ثم ضبطه بشكل دقيق على مهمة أسفلية محددة. رغم أن التدريب المسبق قد أثبت فعاليته في العديد من مجالات اللغة والرؤية، إلا أن السؤال ما زال مفتوحاً حول كيفية استخدام التدريب المسبق بفعالية على مجموعات بيانات الرسوم البيانية (الجرافات). في هذا البحث، نطور استراتيجية جديدة وطرق ذاتية الإشراف للتدريب المسبق للشبكات العصبية الرسومية (GNNs). والمفتاح لنجاح استراتيجيتنا هو تدريب شبكات عصبية رسومية ذات قدرة تعبيرية عالية على مستوى العقد الفردية وعلى مستوى الجرافات بأكملها بحيث يمكن للشبكة العصبية الرسومية أن تتعلم تمثيلات محلية وعالمية مفيدة في آن واحد. ندرس بشكل منهجي التدريب المسبق على عدة مجموعات بيانات تصنيف الجرافات. وقد اكتشفنا أن الاستراتيجيات البسيطة، التي تقوم بتدريب الشبكات العصبية الرسومية على مستوى الجرافات بأكملها أو العقد الفردية فقط، تعطي تحسينات محدودة ويمكن أن تقود حتى إلى نقل سلبي في العديد من المهام الأسفلية. بالمقابل، فإن استراتيجيتنا تتجنب النقل السلبي وتحسن القدرة على التعميم بشكل كبير عبر المهام الأسفلية، مما يؤدي إلى تحسينات مطلقة بنسبة 9.4% في مؤشر ROC-AUC مقارنة بالأنماط غير المدربة سابقاً وتحقق أفضل الأداء الحالي في التنبؤ بخصائص الجزيئات وتوقع وظائف البروتين.