التوافق متعدد اللغات غير المراقب باستخدام المتوسط واسرستاين

نُدرِسُ التموضع متعدد اللغات دون إشراف، وهي مشكلة إيجاد ترجمات كلمة بكلمة بين لغات متعددة دون استخدام أي بيانات متوازية. إحدى الاستراتيجيات الشائعة تتمثل في تبسيط المشكلة متعددة اللغات إلى بيئة ثنائية بسيطة، وذلك باختيار إحدى اللغات المدخلة كلغة محورية نمرُّ بها. ومع ذلك، من المعروف جيدًا أن المرور عبر لغة محورية غير مناسبة (مثل اللغة الإنجليزية) قد يؤدي إلى تدهور كبير في جودة الترجمة، لأن العلاقات التحويلية المفترضة بين جميع أزواج اللغات قد لا تُفرض فعليًا أثناء عملية التدريب. بدلًا من المرور عبر لغة محورية مختارة بشكل عشوائي، نقترح استخدام "متوسط واسيرشتاين" كلغة "متوسطة" أكثر إفادة: فهي تُجسّد المعلومات من جميع اللغات وتُقلل من جميع تكاليف النقل بين الأزواج. وقد قمنا بتقييم طريقتنا على معايير قياسية، وأظهرنا أداءً يُعدّ من أفضل الأداءات الحالية.