نماذج اللغة ليست فقط للتدريب المسبق: نمذجة قناة ضوضاء عصبية مباشرة وسريعة

إن تدريب النماذج مسبقًا على كميات هائلة من البيانات غير المُوسَّمة قد أصبح أسلوبًا فعّالًا لتحسين الدقة في العديد من مهام معالجة اللغة الطبيعية. من ناحية أخرى، يمتلك الترجمة الآلية التقليدية تاريخًا طويلًا في الاستفادة من البيانات غير المُوسَّمة من خلال نمذجة القناة الضوضائية. وقد أُظهر مؤخرًا أن نفس الفكرة تُحقّق تحسينات قوية في الترجمة الآلية العصبية. لكن للأسف، فإن نمذجة القناة الضوضائية البسيطة مع النماذج الحديثة لتحويل التسلسل إلى تسلسل تكون أبطأ بمرتبة من المرات عن البدائل الأخرى. ونعالج هذه المشكلة من خلال تقديم تقريبات فعّالة تجعل عملية الاستنتاج باستخدام نهج القناة الضوضائية بنفس سرعة المجموعات القوية (ensembles) مع زيادة الدقة. كما نُظهر أن نهج القناة الضوضائية يمكنه التفوق على نتائج التدريب المسبق القوية، حيث يحقق حالة جديدة من أفضل النتائج على مهمة الترجمة الرومانية-الإنجليزية في مسابقة WMT.