HyperAIHyperAI
منذ 3 أشهر

التعلم الانتقالي القابل للتوسع مع النماذج الخبيرة

Joan Puigcerver, Carlos Riquelme, Basil Mustafa, Cedric Renggli, André Susano Pinto, Sylvain Gelly, Daniel Keysers, Neil Houlsby
التعلم الانتقالي القابل للتوسع مع النماذج الخبيرة
الملخص

يمكن أن يُحسّن نقل التمثيلات المُدرَّبة مسبقًا من حيث كفاءة العينات ويقلل من المتطلبات الحسابية المطلوبة للمهام الجديدة. ومع ذلك، فإن التمثيلات المستخدمة في النقل غالبًا ما تكون عامة، ولا تُعدّ مخصصة لتوزيع معين من المهام المستقبلية. نستكشف استخدام تمثيلات الخبراء في النقل من خلال استراتيجية بسيطة ولكن فعّالة. نُدرّب مجموعة متنوعة من الخبراء باستغلال الهياكل الحالية للوسوم، ونستخدم مؤشرات أداء رخيصة الحساب لاختيار الخبير المناسب لكل مهمة مستهدفة. تُسهّل هذه الاستراتيجية توسيع عملية النقل إلى مهام جديدة، لأنها لا تتطلب إعادة استعراض بيانات التدريب المسبق أثناء عملية النقل. وبذلك، تتطلب حسابات إضافية قليلة لكل مهمة مستهدفة، وتحقيق تسريع بحدود 2 إلى 3 رتب من القيمة مقارنة بالأساليب التنافسية. علاوة على ذلك، نقدّم معمارية قائمة على المُعدّل (adapter) قادرة على ضغط العديد من الخبراء في نموذج واحد. وقد قُمنا بتقييم منهجنا على مصدرين مختلفين للبيانات، وأظهرنا أنه يتفوّق على النماذج الأساسية في أكثر من 20 مهمة متنوعة في مجال الرؤية الحاسوبية في كلتا الحالتين.