HyperAIHyperAI

Command Palette

Search for a command to run...

هل الترقيم يساعد في النمذجة اللغوية متعددة اللغات؟

Ibraheem Muhammad Moosa Mahmud Elahi Akhter Ashfia Binte Habib

الملخص

تُشكّل تنوع الخطوط تحديًا أمام النماذج اللغوية متعددة اللغات (MLLM) من خلال تقليل التداخل اللفظي بين اللغات المتشابهة جدًا من حيث الأصل. وبالتالي، قد يُحسّن التحويل الصوتي للغات المتشابهة التي تستخدم خطوطًا مختلفة إلى خط مشترك الأداء في المهام اللاحقة للنماذج متعددة اللغات. في هذا السياق، نقيّم تأثير التحويل الصوتي بشكل تجريبي على النماذج متعددة اللغات. ونركّز بشكل خاص على اللغات الهندية، التي تمتلك أعلى درجة من تنوع الخطوط في العالم، ونُقيّم نماذجنا على معيار IndicGLUE. ونُطبّق اختبار مان-ويتني U لتأكيد بدقة ما إذا كان تأثير التحويل الصوتي ذو دلالة إحصائية أم لا. ونجد أن التحويل الصوتي يُفيد اللغات ذات الموارد المحدودة دون التأثير سلبًا على اللغات ذات الموارد الأعلى نسبيًا. كما نقيّم أيضًا تشابه التمثيلات عبر اللغات باستخدام معامل التماثل المركزي للKernel (Centered Kernel Alignment) على جمل متوازية من مجموعة بيانات FLORES-101. ونجد أن النموذج القائم على التحويل الصوتي يتعلم تمثيلات جمل أكثر تشابهًا بين الجمل المتوازية في لغات مختلفة.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
هل الترقيم يساعد في النمذجة اللغوية متعددة اللغات؟ | مستندات | HyperAI