ترجمة آلة عصبية غير مراقبة مبادرة بترجمة آلة إحصائية غير مراقبة

العمل الأخير حقق نتائج ملحوظة في تدريب أنظمة الترجمة الآلية العصبية (NMT) بطريقة غير مراقبة بالكامل، باستخدام هياكل جديدة ومخصصة تعتمد فقط على المجموعات النصية الأحادية اللغة. في هذا البحث، نقترح تعريف الترجمة الآلية العصبية غير المراقبة (UNMT) كنظام ترجمة عصبية تم تدريبه تحت إشراف البيانات الثنائية اللغوية الصناعية. يتيح نهجنا استخدام الهياكل الرائدة المقترحة للترجمة الآلية العصبية المراقبة بسهولة عن طريق استبدال البيانات الثنائية اللغوية التي أنتجها البشر ببيانات ثنائية لغوية صناعية للتدريب. نقترح بدء تدريب UNMT باستخدام بيانات ثنائية لغوية صناعية تم إنشاؤها بواسطة الترجمة الإحصائية الآلية غير المراقبة (USMT). يتم بعد ذلك تحسين نظام UNMT بشكل تدريجي باستخدام الترجمة العكسية. تظهر التجارب الأولية لدينا أن نهجنا يحقق مستوى جديدًا من الريادة في مجال الترجمة الآلية غير المراقبة في مهمة ترجمة الأخبار الألمانية--الإنجليزية لعام WMT16، لكل من اتجاهات الترجمة.