منذ 4 أشهر
زيادة العمق لترجمة الآلة العصبية
Lijun Wu; Yiren Wang; Yingce Xia; Fei Tian; Fei Gao; Tao Qin; Jianhuang Lai; Tie-Yan Liu

الملخص
بينما أثبتت الشبكات العصبية العميقة جدًا فعاليتها في تطبيقات الرؤية الحاسوبية وتصنيف النصوص، فإن كيفية زيادة عمق نماذج الترجمة الآلية العصبية (NMT) لتحسين جودة الترجمة لا تزال مشكلة صعبة. إضافة المزيد من الكتل مباشرة إلى نموذج NMT لا تؤدي إلى أي تحسين بل قد تقلل من الأداء. في هذا العمل، نقترح نهجًا فعالًا على مرحلتين مع ثلاثة مكونات مصممة خصيصًا لبناء نماذج NMT أعمق، مما يؤدي إلى تحسينات كبيرة على أساسيات Transformer القوية في مهام الترجمة من الإنجليزية إلى الألمانية ومن الإنجليزية إلى الفرنسية في WMT 14\footnote{يمكن الوصول إلى كودنا عبر الرابط \url{https://github.com/apeterswu/Depth_Growing_NMT}}.