HyperAIHyperAI
منذ 2 أشهر

فهم الترجمة العكسية على نطاق واسع

Sergey Edunov; Myle Ott; Michael Auli; David Grangier
فهم الترجمة العكسية على نطاق واسع
الملخص

طريقة فعالة لتحسين الترجمة الآلية العصبية باستخدام البيانات الأحادية اللغة هي توسيع المكتبة التدريبية المتوازية بإضافة ترجمات عكسية للجمل باللغة الهدف. يوسع هذا البحث فهم مفهوم الترجمة العكسية ويستكشف عددًا من الأساليب لتوليد جمل المصدر الصناعية. وقد وجدنا أن في جميع الحالات ما عدا تلك ذات الموارد القليلة، تكون الترجمات العكسية التي تم الحصول عليها عبر السحب أو إدخال الضوضاء على نواتج الشعاع الأكثر فعالية. تظهر تحليلاتنا أن البيانات الصناعية الناتجة عن السحب أو البيانات المشوهة تعطي إشارة تدريب أقوى بكثير من البيانات المولدة بواسطة الشعاع أو البحث الجشع. كما نقارن بين كيفية مقارنة البيانات الصناعية مع النصوص الثنائية الحقيقية وندرس آثار مختلفة للحقول (domains). وأخيرًا، نقوم بتوسيع نطاق العمل ليشمل مئات الملايين من الجمل الأحادية اللغة ونحقق مستوى جديدًا من الدقة بلغ 35 درجة في مقاييس BLEU على مجموعة اختبار WMT'14 الإنجليزية-الألمانية.

فهم الترجمة العكسية على نطاق واسع | أحدث الأوراق البحثية | HyperAI