الأفضل من العالمين: دمج التقدم الحديث في الترجمة الآلية العصبية

شهد العام الماضي تقدماً سريعاً في نمذجة التسلسل إلى تسلسل (seq2seq) لترجمة الآلة (MT). كانت النماذج التقليدية القائمة على الشبكات العصبية المتكررة (RNN) أول من تم تجاوز أدائها بواسطة نموذج التحويل التتابعي (convolutional seq2seq)، الذي تم بدوره تجاوز أدائه بواسطة النموذج الأكثر حداثة وهو نموذج التحويل (Transformer). يتكون كل من هذه النماذج الجديدة من هندسة أساسية مصحوبة بمجموعة من تقنيات النمذجة والتدريب التي يمكن تطبيقها في المبدأ على هياكل أخرى للتحويل التتابعي. في هذا البحث، نفصل بين الهندسات الجديدة وتقنياتها المرافقة بطريقتين. أولاً، نحدد عدة تقنيات رئيسية للنمذجة والتدريب، ونطبقها على الهندسة القائمة على RNN، مما يؤدي إلى إنشاء نموذج RNMT+ جديد يتفوق على جميع الثلاثة هياكل أساسية في مهمتي الاختبار القياسي WMT'14 من الإنجليزية إلى الفرنسية ومن الإنجليزية إلى الألمانية. ثانياً، نحلل خصائص كل هندسة أساسية للتحويل التتابعي ونطور هياكل Hibrid جديدة مصممة لدمج نقاط قوتها. حققت نماذجنا الهيبريد تحسينات إضافية، حيث تفوقت على نموذج RNMT+ في كلا المجموعتين القياسيتين للبيانات.