HyperAIHyperAI
منذ 17 أيام

التوافق متعدد اللغات غير المراقب باستخدام المتوسط واسرستاين

Xin Lian, Kshitij Jain, Jakub Truszkowski, Pascal Poupart, Yaoliang Yu
التوافق متعدد اللغات غير المراقب باستخدام المتوسط واسرستاين
الملخص

نُدرِسُ التموضع متعدد اللغات دون إشراف، وهي مشكلة إيجاد ترجمات كلمة بكلمة بين لغات متعددة دون استخدام أي بيانات متوازية. إحدى الاستراتيجيات الشائعة تتمثل في تبسيط المشكلة متعددة اللغات إلى بيئة ثنائية بسيطة، وذلك باختيار إحدى اللغات المدخلة كلغة محورية نمرُّ بها. ومع ذلك، من المعروف جيدًا أن المرور عبر لغة محورية غير مناسبة (مثل اللغة الإنجليزية) قد يؤدي إلى تدهور كبير في جودة الترجمة، لأن العلاقات التحويلية المفترضة بين جميع أزواج اللغات قد لا تُفرض فعليًا أثناء عملية التدريب. بدلًا من المرور عبر لغة محورية مختارة بشكل عشوائي، نقترح استخدام "متوسط واسيرشتاين" كلغة "متوسطة" أكثر إفادة: فهي تُجسّد المعلومات من جميع اللغات وتُقلل من جميع تكاليف النقل بين الأزواج. وقد قمنا بتقييم طريقتنا على معايير قياسية، وأظهرنا أداءً يُعدّ من أفضل الأداءات الحالية.

التوافق متعدد اللغات غير المراقب باستخدام المتوسط واسرستاين | أحدث الأوراق البحثية | HyperAI