الملخص

أظهرت نماذج اللغة الكبيرة (LLMs) قدرات ملحوظة في مجالات متنوعة، لكن تدريبها ما زال يتطلب موارد كبيرة ووقتًا طويلاً، ما يستدعي قوة حوسبة هائلة وتنسيقًا دقيقًا لإجراءات التدريب. وقد ظهرت تقنية "مُرَقَّع النماذج" (Model Souping) – وهي ممارسة تتمثّل في متوسطة أوزان نماذج متعددة من نفس البنية المعمارية – كطريقة واعدة مُطبَّقة قبل وبعد التدريب، تُحسِّن الأداء دون الحاجة إلى إعادة تدريب مكلفة. في هذا البحث، نقدّم "مُرَقَّع خبراء الفئات" (SoCE)، وهي منهجية مبنية على مبادئ علمية لتقنية مُرَقَّع النماذج، تستخدم تكوين المعايير (benchmark composition) لتحديد النماذج المثلى، وتطبّق متوسطًا موزونًا غير متساوٍ لتعظيم الأداء. على عكس الطرق السابقة التي تعتمد على المتوسط المتساوي، يستفيد منهجنا من ملاحظة أن فئات المعايير غالبًا ما تُظهر ارتباطات متدنية بين أداء النماذج. فـ SoCE تُحدِّد النماذج "الخَبِيرَة" لكل مجموعة من الفئات ذات الارتباط الضعيف، وتحسّن أداءها من خلال متوسط موزون مُحسَّن بدلًا من الأوزان المتساوية. ونُظهر من خلال هذا البحث أن المنهج المقترح يُحسِّن الأداء والثبات عبر عدة مجالات، بما في ذلك القدرة متعددة اللغات، واستدعاء الأدوات، والرياضيات، ويحقق نتائج رائدة على لوحة التصنيف الوظيفي بجامعة بركلي (Berkeley Function Calling Leaderboard).

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

Command Palette

نموذج سوبر: كيف تُفْتَحُ أداء نماذج اللغة المتقدمة من خلال الحساب البسيط

Shalini Maiti Amar Budhiraja Bhavul Gauri Gaurav Chaurasia Anton Protopopov Alexis Audran-Reiss Michael Slater Despoina Magka Tatiana Shavrina Roberta Raileanu1 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

نموذج سوبر: كيف تُفْتَحُ أداء نماذج اللغة المتقدمة من خلال الحساب البسيط

Shalini Maiti Amar Budhiraja Bhavul Gauri Gaurav Chaurasia Anton Protopopov Alexis Audran-Reiss Michael Slater Despoina Magka Tatiana Shavrina Roberta Raileanu1 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

نموذج سوبر: كيف تُفْتَحُ أداء نماذج اللغة المتقدمة من خلال الحساب البسيط

Shalini Maiti Amar Budhiraja Bhavul Gauri Gaurav Chaurasia Anton Protopopov Alexis Audran-Reiss Michael Slater Despoina Magka Tatiana Shavrina Roberta Raileanu1 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Shalini Maiti Amar Budhiraja Bhavul Gauri Gaurav Chaurasia Anton Protopopov Alexis Audran-Reiss Michael Slater Despoina Magka Tatiana Shavrina Roberta Raileanu

Shalini Maiti Amar Budhiraja Bhavul Gauri Gaurav Chaurasia Anton Protopopov Alexis Audran-Reiss Michael Slater Despoina Magka Tatiana Shavrina Roberta Raileanu

Shalini Maiti Amar Budhiraja Bhavul Gauri Gaurav Chaurasia Anton Protopopov Alexis Audran-Reiss Michael Slater Despoina Magka Tatiana Shavrina Roberta Raileanu