HyperAIHyperAI

Command Palette

Search for a command to run...

الترجمة العصبية الآلية غير المراقبة

Mikel Artetxe; Gorka Labaka; Eneko Agirre; Kyunghyun Cho

الملخص

رغم النجاحات الحديثة لترجمة الآلة العصبية (NMT) في المعايير القياسية، فإن نقص البيانات المتوازية الكبيرة يشكل مشكلة عملية رئيسية للعديد من أزواج اللغات. قد تم تقديم عدة اقتراحات لتخفيف هذه المشكلة، مثل تقنيات التثليث والتعلم شبه المنظوم، ولكنها لا تزال تتطلب إشارة عابرة للغات قوية. في هذا البحث، نحن نزيل تمامًا الحاجة إلى البيانات المتوازية ونقترح طريقة جديدة لتدريب نظام ترجمة الآلة العصبية بطريقة غير مراقبة تمامًا، معتمدين فقط على Corpora أحادية اللغة. نموذجنا يستند إلى الأبحاث الحديثة حول الخرائط المضمنة غير المراقبة، ويتألف من نموذج مشفّر-مفكك (Encoder-Decoder) ذو انتباه معدّل قليلًا يمكن تدريبه على Corpora أحادية اللغة باستخدام مزيج من التنقية (Denoising) والترجمة العكسية (Backtranslation). رغم بساطة هذا النهج، فإن نظامنا يحقق 15.56 و10.21 نقطة BLEU في ترجمة WMT 2014 من الفرنسية إلى الإنجليزية ومن الألمانية إلى الإنجليزية على التوالي. يمكن أيضًا لنموذجنا الاستفادة من Corpora متوازية صغيرة، حيث يصل إلى 21.81 و15.24 نقطة عند دمجه مع 100,000 جملة متوازية، على التوالي. لقد تم إطلاق تنفيذنا كمشروع مفتوح المصدر.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp