الترجمة العصبية الآلية غير الترتيبية

الطرق الحالية للترجمة الآلية العصبية تعتمد على تكييف كل كلمة مُخرجة على الكلمات المُنتجة سابقًا. نقدم نموذجًا يتجنب هذه الخاصية التلقائية ويُنتج مخرجاته بشكل متوازي، مما يسمح بتقليل زمن الاستجابة بمقدار عَشرة أضعاف أثناء الاستدلال. من خلال تقليص المعرفة، واستخدام خصوبة الرموز الدخلية كمتغير كامن، وتحسين التدريب باستخدام التدرجات السلوكية (Policy Gradient)، نحقق هذا بأقل تكلفة تبلغ 2.0 نقطة BLEU مقارنة بشبكة Transformer التلقائية المستخدمة كمعلم. نظهر التحسينات التراكمية الكبيرة المرتبطة بكل من الجوانب الثلاثة لاستراتيجيتنا في التدريب، ونؤكد صحة نهجنا على زوجي اللغة الإنجليزية-الألمانية في IWSLT 2016 واثنين من أزواج اللغات في WMT. بأخذ عينات من الخصوبات بشكل متوازي أثناء الاستدلال، يصل نموذجنا غير التلقائي إلى أداء قريب من الأفضل عالميًا بمعدل 29.8 BLEU على WMT 2016 الإنجليزية-الرومانية.