النماذج العميقة المتكررة مع الاتصالات السريعة للأمام للترجمة الآلية العصبية

الترجمة العصبية الآلية (NMT) تهدف إلى حل مشكلات الترجمة الآلية (MT) باستخدام الشبكات العصبية وقد أظهرت نتائج واعدة في السنوات الأخيرة. ومع ذلك، فإن معظم النماذج الحالية للترجمة العصبية الآلية ضحلة وهناك فجوة في الأداء بين نموذج واحد من NMT والأنظمة التقليدية الأفضل لـ MT. في هذا العمل، نقدم نوعًا جديدًا من الاتصالات الخطية يُسمى اتصالات السير السريع (fast-forward connections)، استنادًا إلى شبكات الذاكرة طويلة المدى قصيرة المدى العميقة (LSTM)، وبنية ثنائية الاتجاه متعاقبة لتجميع طبقات LSTM. تلعب اتصالات السير السريع دورًا أساسيًا في نشر التدرجات وبناء طوبولوجيا عميقة بعمق 16. على مهمة الترجمة الإنجليزية-الفرنسية في WMT'14، حققنا BLEU=37.7 باستخدام نموذج انتباه واحد، مما يتفوق على النموذج الضحل المماثل بمقدار 6.2 نقطة BLEU. هذه هي المرة الأولى التي يحقق فيها نموذج واحد من NMT أداءً رائدًا ويتفوق على أفضل نموذج تقليدي بمقدار 0.7 نقطة BLEU. يمكننا تحقيق BLEU=36.3 حتى دون استخدام آلية الانتباه. بعد التعامل الخاص مع الكلمات غير المعروفة وتجميع النماذج، حصلنا على أفضل درجة تم الإبلاغ عنها حتى الآن在这项任务上,BLEU=40.4。我们的模型也在更困难的WMT'14 英语-德语任务中得到了验证。请注意,最后一句中的“在这项任务上”和“我们的模型”在阿拉伯语中应该翻译为:في هذه المهمة، حصلنا على أفضل درجة تم الإبلاغ عنها حتى الآن بقيمة BLEU=40.4. كما تم التحقق من صحة نماذجنا في مهمة WMT'14 الأكثر صعوبة للترجمة الإنجليزية-الألمانية.因此,完整的翻译如下:الترجمة العصبية الآلية (NMT) تهدف إلى حل مشكلات الترجمة الآلية (MT) باستخدام الشبكات العصبية وقد أظهرت نتائج واعدة في السنوات الأخيرة. ومع ذلك، فإن معظم النماذج الحالية للترجمة العصبية الآلية ضحلة وهناك فجوة في الأداء بين نموذج واحد من NMT والأنظمة التقليدية الأفضل لـ MT. في هذا العمل، نقدم نوعًا جديدًا من الاتصالات الخطية يُسمى اتصالات السير السريع (fast-forward connections)، استنادًا إلى شبكات الذاكرة طويلة المدى قصيرة المدى العميقة (LSTM)، وبنية ثنائية الاتجاه متعاقبة لتجميع طبقات LSTM. تلعب اتصالات السير السريع دورًا أساسيًا في نشر التدرجات وبناء طوبولوجيا عميقة بعمق 16. على مهمة الترجمة الإنجليزية-الفرنسية في WMT'14، حققنا BLEU=37.7 باستخدام نموذج انتباه واحد، مما يتفوق على النموذج الضحل المماثل بمقدار 6.2 نقطة BLEU. هذه هي المرة الأولى التي يحقق فيها نموذج واحد من NMT أداءً رائدًا ويتفوق على أفضل نموذج تقليدي بمقدار 0.7 نقطة BLEU. يمكننا تحقيق BLEU=36.3 حتى دون استخدام آلية الانتباه. بعد التعامل الخاص مع الكلمات غير المعروفة وتجميع النماذج، حصلنا على أفضل درجة تم الإبلاغ عنها حتى الآن في هذه المهمة بقيمة BLEU=40.4. كما تم التحقق من صحة نماذجنا في مهمة WMT'14 الأكثر صعوبة للترجمة الإنجليزية-الألمانية.