Command Palette
Search for a command to run...
هل الترقيم يساعد في النمذجة اللغوية متعددة اللغات؟
هل الترقيم يساعد في النمذجة اللغوية متعددة اللغات؟
Ibraheem Muhammad Moosa Mahmud Elahi Akhter Ashfia Binte Habib
الملخص
تُشكّل تنوع الخطوط تحديًا أمام النماذج اللغوية متعددة اللغات (MLLM) من خلال تقليل التداخل اللفظي بين اللغات المتشابهة جدًا من حيث الأصل. وبالتالي، قد يُحسّن التحويل الصوتي للغات المتشابهة التي تستخدم خطوطًا مختلفة إلى خط مشترك الأداء في المهام اللاحقة للنماذج متعددة اللغات. في هذا السياق، نقيّم تأثير التحويل الصوتي بشكل تجريبي على النماذج متعددة اللغات. ونركّز بشكل خاص على اللغات الهندية، التي تمتلك أعلى درجة من تنوع الخطوط في العالم، ونُقيّم نماذجنا على معيار IndicGLUE. ونُطبّق اختبار مان-ويتني U لتأكيد بدقة ما إذا كان تأثير التحويل الصوتي ذو دلالة إحصائية أم لا. ونجد أن التحويل الصوتي يُفيد اللغات ذات الموارد المحدودة دون التأثير سلبًا على اللغات ذات الموارد الأعلى نسبيًا. كما نقيّم أيضًا تشابه التمثيلات عبر اللغات باستخدام معامل التماثل المركزي للKernel (Centered Kernel Alignment) على جمل متوازية من مجموعة بيانات FLORES-101. ونجد أن النموذج القائم على التحويل الصوتي يتعلم تمثيلات جمل أكثر تشابهًا بين الجمل المتوازية في لغات مختلفة.