الملخص

التدريب على المهام الوسيطة---تحسين نموذج مُدرب مسبقًا على مهمة وسيطة قبل تحسينه مرة أخرى على المهمة المستهدفة---غالبًا ما يُحسن أداء النموذج بشكل كبير في مهام فهم اللغة ضمن الإعدادات الأحادية اللغة الإنجليزية. نحن نستكشف ما إذا كان التدريب على المهام الوسيطة باللغة الإنجليزية لا يزال مفيدًا في المهام المستهدفة غير الإنجليزية. باستخدام تسعة مهام وسيطة لفهم اللغة، نقيم نقل المهام الوسيطة في إعداد عابر للغات بدون تدريب (zero-shot cross-lingual) على مقاييس XTREME. نلاحظ تحسينات كبيرة من التدريب الوسيطي في مهمتي استرجاع الجمل BUCC وTatoeba، وتحسينات معتدلة في مهمات الإجابة عن الأسئلة المستهدفة. تحقق MNLI وSQuAD وHellaSwag أفضل النتائج الشاملة كمهام وسيطة، بينما يوفر التدريب الوسيطي متعدد المهام تحسينات إضافية صغيرة. باستخدام أفضل نماذج التدريب الوسيطي لدينا لكل مهمة مستهدفة، نحصل على تحسين بـ 5.4 نقطة فوق XLM-R Large على مقاييس XTREME، مما يجعلنا راسخين في طليعة التقنيات حتى يونيو 2020. كما نستكشف الاستمرار في التعلم متعدد اللغات للنماذج اللغوية (MLM) خلال التدريب الوسيطي واستخدام بيانات المهمة الوسيطة التي تم ترجمتها آليًا، ولكن لا شيء من ذلك يتفوق باستمرار على مجرد أداء التدريب الوسيطي باللغة الإنجليزية.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

Command Palette

التدريب على المهام الوسيطة باللغة الإنجليزية يحسن النقل العابر للغات بدون تدريب مسبق أيضًا

Jason Phang; Iacer Calixto; Phu Mon Htut; Yada Pruksachatkun; Haokun Liu; Clara Vania; Katharina Kann; Samuel R. Bowman

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

التدريب على المهام الوسيطة باللغة الإنجليزية يحسن النقل العابر للغات بدون تدريب مسبق أيضًا

Jason Phang; Iacer Calixto; Phu Mon Htut; Yada Pruksachatkun; Haokun Liu; Clara Vania; Katharina Kann; Samuel R. Bowman

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

التدريب على المهام الوسيطة باللغة الإنجليزية يحسن النقل العابر للغات بدون تدريب مسبق أيضًا

Jason Phang; Iacer Calixto; Phu Mon Htut; Yada Pruksachatkun; Haokun Liu; Clara Vania; Katharina Kann; Samuel R. Bowman

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters