HyperAIHyperAI

Command Palette

Search for a command to run...

XLM-T: نماذج اللغات متعددة اللغات في تويتر لتحليل المشاعر وما بعده

Francesco Barbieri Luis Espinosa Anke Jose Camacho-Collados

الملخص

تُعد نماذج اللغة شائعة الانتشار في معالجة اللغة الطبيعية الحالية، وقد لاقت قدرتها متعددة اللغات اهتمامًا متزايدًا في الآونة الأخيرة. ومع ذلك، ركزت التحليلات الحالية تقريبًا بشكل حصري على معايير معيارية قياسية (بصيغ متعددة اللغات)، واعتمدت على بيانات تدريب نظيفة ومجاميع بيانات مخصصة للمهام كإشارات متعددة اللغات. في هذه الورقة، نقدّم نموذج XLM-T، وهو نموذج مُصمم لتدريب وتقييم نماذج اللغة متعددة اللغات على منصة تويتر. وتتضمن هذه الورقة ما يلي: (1) قاعدة معيارية قوية جديدة متعددة اللغات، تتكون من نموذج XLM-R (Conneau et al. 2020) المُدرّب مسبقًا على ملايين التغريدات بلغات تتجاوز ثلاثين لغة، بالإضافة إلى رمز مبدئي (starter code) لتمكين التخصيص اللاحق على مهمة مستهدفة؛ و(2) مجموعة من مجموعات بيانات تحليل المشاعر الموحّدة على تويتر بلغات ثمانية مختلفة، ونموذج XLM-T المُعدّل (fine-tuned) عليها.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
XLM-T: نماذج اللغات متعددة اللغات في تويتر لتحليل المشاعر وما بعده | مستندات | HyperAI