HyperAIHyperAI
منذ 2 أشهر

ترجمة الأعصاب غير الموجهة للآلات مع ترقيم اللاحقة باستخدام الترجمة الإحصائية للآلات

Shuo Ren; Zhirui Zhang; Shujie Liu; Ming Zhou; Shuai Ma
ترجمة الأعصاب غير الموجهة للآلات مع ترقيم اللاحقة باستخدام الترجمة الإحصائية للآلات
الملخص

بدون توفر مكتبة ثنائية اللغة حقيقية، يعتمد الترجمة الآلية العصبية غير المراقبة (NMT) عادةً على بيانات شبه متوازية تُولَد باستخدام طريقة الترجمة العكسية للتدريب على النموذج. ومع ذلك، بسبب الرقابة الضعيفة، تحتوي البيانات الشبه على ضوضاء وأخطاء لا مفر منها ستتجمع وتتعزز في عملية التدريب اللاحقة، مما يؤدي إلى أداء ترجمة سيء. لحل هذه المشكلة، نقدم نماذج الترجمة الإحصائية القائمة على الجمل (SMT) التي تكون مقاومة للبيانات الضوضائية كتنظيمات ما بعد لتهدي الطaining غير المراقب للنماذج NMT في عملية الترجمة العكسية المتكررة. تبدأ طريقتنا من نماذج SMT تم بناؤها باستخدام نماذج اللغة المدربة مسبقًا وجداول الترجمة على مستوى الكلمات المستنبطة من الانغراسات اللغوية المتعددة. ثم يتم تحسين النماذج SMT و NMT معًا بشكل مشترك وتعزيز كل منهما تدريجيًا في إطار EM الموحد. بهذه الطريقة، (1) يمكن تخفيف الأثر السلبي الناجم عن الأخطاء في عملية الترجمة العكسية المتكررة بسرعة بواسطة تنقية SMT للضوضاء من جداول الجمل الخاصة بها؛ وفي الوقت نفسه، (2) يمكن لنموذج NMT تعويض نقص السلاسة الموجود بشكل طبيعي في نموذج SMT. أظهرت التجارب التي أجريت على مهام الترجمة بين الإنجليزية والفرنسية والإنجليزية والألمانية أن طريقتنا تتفوق على الخط الأساسي القوي وتحقق أداءً جديدًا يعد أفضل ما وصل إليه مجال الترجمة الآلية غير المراقبة.请注意,这里的“تنقية”是指SMT通过其短语表过滤噪音数据的过程,而“سلاسة”指的是翻译的流畅度。希望这个翻译能够满足您的需求。如果有任何需要进一步调整的地方,请随时告知。

ترجمة الأعصاب غير الموجهة للآلات مع ترقيم اللاحقة باستخدام الترجمة الإحصائية للآلات | أحدث الأوراق البحثية | HyperAI