منذ 13 أيام
mT5: نموذج مُدرَّب مسبقًا متعدد اللغات على نطاق واسع من نوع نموذج نص إلى نص قائم على المحولات
Linting Xue, Noah Constant, Adam Roberts, Mihir Kale, Rami Al-Rfou, Aditya Siddhant, Aditya Barua, Colin Raffel

الملخص
يُعد نموذج "تحويل الترجمة النصية إلى النصية" (T5) الأخير الذي استخدم تنسيقًا موحدًا للنص إلى النص ومقاييس كبيرة لتحقيق نتائج رائدة في مجال مهام معالجة اللغة الطبيعية باللغة الإنجليزية المختلفة. في هذه الورقة البحثية، نقدّم mT5، وهو نسخة متعددة اللغات من نموذج T5، تم تدريبه مسبقًا على مجموعة بيانات جديدة مستمدة من Common Crawl تغطي 101 لغة. ونُفصّل في تصميم mT5 وطريقة تدريبه المُعدّلة، ونُظهر أداؤه الرائد على العديد من المعايير متعددة اللغات. كما نصف تقنية بسيطة تُستخدم لمنع ظاهرة "الترجمة العرضية" في البيئة ذات الصفر المُحاكاة، حيث يختار النموذج التوليدي (جزئيًا أو كليًا) ترجمة تنبؤه إلى لغة خاطئة. جميع الكودات ونقاط التحقق (checkpoints) المستخدمة في هذه الدراسة متاحة للجمهور بشكل عام.