HyperAIHyperAI
منذ 2 أشهر

LogME: تقييم عملي للنماذج المدربة مسبقًا لنقل التعلم

Kaichao You; Yong Liu; Jianmin Wang; Mingsheng Long
LogME: تقييم عملي للنماذج المدربة مسبقًا لنقل التعلم
الملخص

يقوم هذا البحث بدراسة اختيار النماذج المدربة مسبقًا المتكيفة مع المهمة، وهو مشكلة غير مستكشفة بشكل كافٍ تتعلق بتقييم النماذج المدربة مسبقًا للمهمة المستهدفة واختيار الأفضل منها من مجموعة النماذج \emph{بدون إعادة التدريب الدقيق}. قد عالجت بعض الأعمال الأولية المشكلة في نقل النماذج المدربة مسبقًا تحت إشراف إلى مهمات التصنيف، لكنها لا تستطيع التعامل مع النماذج المدربة مسبقًا الغير خاضعة للإشراف أو مهمات الانحدار. في سعي لتحقيق طريقة تقييم عملية، نقترح تقدير القيمة القصوى لدليل العلامة (label evidence) المعطى الخصائص المستخرجة من قبل النماذج المدربة مسبقًا. على عكس الإمكانية القصوى، فإن الدليل القصوي \emph{معافى من الاستغراق الزائد}، بينما يمكن تقليل حسابه الباهظ الثمن بشكل كبير بواسطة خوارزميتنا المصممة بدقة. يمكن استخدام لوغاريتم الاحتمال الأقصى (Logarithm of Maximum Evidence - LogME) لتقييم النماذج المدربة مسبقًا للتعلم المنقول: فالنموذج المدرب مسبقًا ذو قيمة LogME عالية من المحتمل أن يكون له أداء نقل جيد. يتميز LogME بأنه \emph{سريع ودقيق ومتنوع}، مما يجعله أول طريقة عملية لتقييم النماذج المدربة مسبقًا. بالمقارنة مع إعادة التدريب الدقيق بطريقة عمياء، يوفر LogME تسريعًا يصل إلى $3000\times$ في الوقت الفعلي ويحتاج فقط إلى $1\%$ من المساحة الذاكرة. يتفوق على الطرق السابقة بمقدار كبير في الإعداد الخاص بها ويمكن تطبيقه على إعدادات جديدة. إنه عام بما يكفي ليشمل نماذج متعددة مدربة مسبقًا (مدربة تحت إشراف ومدربة بدون إشراف)، ومهمات لاحقة (تصنيف وانحدار)، وأشكال مختلفة (رؤية ولغة). يمكن الحصول على الكود من هذا المستودع: \href{https://github.com/thuml/LogME}{https://github.com/thuml/LogME}.

LogME: تقييم عملي للنماذج المدربة مسبقًا لنقل التعلم | أحدث الأوراق البحثية | HyperAI