HyperAIHyperAI
منذ 2 أشهر

نهج فعال للترجمة الآلية غير المشرفة

Mikel Artetxe; Gorka Labaka; Eneko Agirre
نهج فعال للترجمة الآلية غير المشرفة
الملخص

بينما اعتمد الترجمة الآلية تقليديًا على كميات كبيرة من المجموعات المتوازية، فقد نجحت سلسلة بحثية حديثة في تدريب أنظمة الترجمة العصبية (NMT) والترجمة الإحصائية (SMT) باستخدام المجموعات الأحادية اللغة فقط. في هذا البحث، نحدد ونعالج عدة عيوب للطرق الحالية للترجمة الإحصائية غير المراقبة من خلال استغلال معلومات الوحدات الفرعية للكلمات، وتطوير طريقة ضبط غير مراقبة ذات أساس نظري قوي، وإدخال إجراء تحسين مشترك. بالإضافة إلى ذلك، نستخدم نظامنا الإحصائي المحسن لتهيئة نموذج الترجمة العصبية الثنائي، والذي يتم ضبطه بشكل دقيق أكثر من خلال الترجمة العكسية الفورية. معًا، حققنا تحسينات كبيرة على الحالة السابقة لأفضل ما هو معروف في مجال الترجمة الآلية غير المراقبة. على سبيل المثال، حصلنا على 22.5 نقطة BLEU في ترجمة الإنجليزية إلى الألمانية لتحدي WMT 2014، وهو ما يزيد بمقدار 5.5 نقطة عن أفضل نظام غير مراقب سابق، وبمقدار 0.5 نقطة عن الفائز المشترك بالمهمة (المراقب) في عام 2014.

نهج فعال للترجمة الآلية غير المشرفة | أحدث الأوراق البحثية | HyperAI