HyperAIHyperAI

Command Palette

Search for a command to run...

BigTranslate: تعزيز النماذج اللغوية الكبيرة بقدرات الترجمة متعددة اللغات عبر أكثر من 100 لغة

Wen Yang Chong Li Jiajun Zhang Chengqing Zong

الملخص

تُظهر النماذج اللغوية الكبيرة (LLMs) أداءً واعدًا في الترجمة بين مختلف اللغات الطبيعية. ومع ذلك، فإن العديد من هذه النماذج، وخاصة تلك المفتوحة المصدر مثل BLOOM وLLaMA، تُظهر تمركزًا قويًا باللغة الإنجليزية وتدعم فقط عشرين إلى ثلاثين لغة طبيعية، ما يجعل الإمكانات الكامنة للنماذج الكبيرة في مجال الترجمة اللغوية غير مُستغلة بالكامل. في هذا العمل، نقدّم نموذج BigTranslate، الذي يُعدّل نموذج LLaMA الذي يغطي فقط 20 لغة، ويعزز قدرته على الترجمة متعددة اللغات ليشمل أكثر من 100 لغة. يُبنى BigTranslate على نموذج LLaMA-13B، ويتم تحسينه عبر ثلاث مراحل: أولاً، نُواصل تدريب نموذج LLaMA باستخدام كميات ضخمة من البيانات الأحادية اللغة الصينية. ثانيًا، نُواصل التدريب باستخدام مجموعة بيانات متوازية ضخمة تشمل 102 لغة طبيعية. ثالثًا، نُنفّذ عملية التوجيه (instruct-tune) على النموذج الأساسي باستخدام تعليمات ترجمة متعددة اللغات، مما يؤدي إلى نموذج BigTranslate النهائي. أظهرت التجارب الأولية في الترجمة متعددة اللغات أن BigTranslate يُقدّم أداءً مماثلًا لـ ChatGPT وGoogle Translate في العديد من اللغات، ويتخطى حتى أداء ChatGPT في 8 أزواج لغوية. نُعلن عن إصدار نموذج BigTranslate ونأمل أن يُسهم في دفع عجلة التقدم في الأبحاث في هذا المجال.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp