HyperAIHyperAI
منذ 2 أشهر

تحسين نماذج الترجمة الآلية العصبية باستخدام البيانات الأحادية اللغة

Rico Sennrich; Barry Haddow; Alexandra Birch
تحسين نماذج الترجمة الآلية العصبية باستخدام البيانات الأحادية اللغة
الملخص

ترجمة الآلة العصبية (NMT) حققت أداءً رائدًا في عدة أزواج من اللغات باستخدام بيانات متوازية فقط للتدريب. تلعب البيانات الأحادية اللغة على الجانب المستهدف دورًا مهمًا في تعزيز سلاسة الترجمة الإحصائية القائمة على الجمل، ونقوم بدراسة استخدام البيانات الأحادية اللغة لترجمة الآلة العصبية. بخلاف الأعمال السابقة التي تجمع بين نماذج ترجمة الآلة العصبية والأنماط اللغوية المدربة بشكل منفصل، نلاحظ أن هياكل الترميز-التفكيك في ترجمة الآلة العصبية لديها القدرة بالفعل على تعلم المعلومات نفسها التي يتعلمها النموذج اللغوي، ونستكشف استراتيجيات لتدريب النموذج باستخدام البيانات الأحادية اللغة دون تغيير هيكل الشبكة العصبية. من خلال زوج البيانات التدريبية الأحادية اللغة مع الترجمة العكسية التلقائية، يمكننا التعامل معها كبيانات تدريب متوازية إضافية، وقد حصلنا على تحسينات كبيرة في مهمة WMT 15 (الإنجليزية <-> الألمانية (+2.8-3.7 BLEU))، وفي مهمة IWSLT 14 ذات الموارد المنخفضة (التركية -> الإنجليزية (+2.1-3.4 BLEU))، مما مكّننا من تحقيق نتائج جديدة رائدة. كما أظهرنا أن التعديل الدقيق على البيانات الأحادية والمتوازية داخل المجال يوفر تحسينات كبيرة لمهمة IWSLT 15 (الإنجليزية -> الألمانية).

تحسين نماذج الترجمة الآلية العصبية باستخدام البيانات الأحادية اللغة | أحدث الأوراق البحثية | HyperAI