التعلم البايزي للنُّسَق في تعميم نماذج الصورة واللغة

لقد أثارت نماذج الصور واللغة الأساسية اهتمامًا كبيرًا بفضل قدرتها الفعّالة على التكيّف مع المهام اللاحقة من خلال التعلّم بالتحفيز (prompt learning). يُعامل التعلّم بالتحفيز جزءًا من مدخلات نموذج اللغة على أنه قابل للتدريب، بينما يتم تجميد الباقي، ويتم تحسين دالة تقليل المخاطر التجريبية (Empirical Risk Minimization). ومع ذلك، يُعرف أن تقليل المخاطر التجريبية يعاني من انزلاقات في التوزيع، مما يُضعف القدرة على التعميم بالنسبة للتحفيزات غير المرئية أثناء التدريب. وباستغلال قدرة الطرق البايزية على الت régularisation، نُصِرِّف التعلّم بالتحفيز من منظور بازِي، ونُصَفّيه كمشكلة استدلال تبايني (variational inference). يُعدّ نهجنا يُنظم فضاء التحفيز، ويقلّل من التعلّم الزائد (overfitting) على التحفيزات المرئية، ويعزّز التعميم على التحفيزات غير المرئية. يتم تنفيذ إطارنا من خلال نمذجة فضاء التحفيز المدخل بأسلوب احتمالي، كتوزيع أولي (a priori distribution)، مما يجعل اقتراحنا متوافقًا مع أساليب التعلّم بالتحفيز التي لا تُشترط على الصورة أو التي تُشترط عليها. ونُظهر تجريبيًا على 15 معيارًا أن التعلّم بالتحفيز البايزي يوفر تغطية مناسبة لفضاء التحفيز، ويمنع التعلّم على سمات وهمية، ويستغل السمات الثابتة القابلة للنقل. وهذا يؤدي إلى تحسين التعميم على التحفيزات غير المرئية، حتى عبر مجموعات بيانات وأطر عمل مختلفة. الكود متاح عبر: https://github.com/saic-fi/Bayesian-Prompt-Learning