منذ 6 أشهر

الملخص

تُظهر النماذج اللغوية الكبيرة (LLMs) قدرات ناشئة في مهام الاستدلال الرياضي، ويزداد الاهتمام بتعزيز قدرة النماذج المفتوحة المصدر من خلال التدريب المراقب (SFT). في هذه الورقة، نهدف إلى استكشاف استراتيجية بيانات عامة للبيانات المراقبة لتحسين وتوسيع قدرة الاستدلال الرياضي. أولاً، نحدد حدود القدرة على تكثيف مسارات الاستدلال من خلال تحديد المجموعة المثلى الأدنى من هذه المسارات. ثانيًا، نؤكد أن القدرات المختلفة للنموذج يمكن تعزيزها تراكميًا من خلال مزيج المجموعات المثلى الدنيا من أنواع البيانات المقابلة، بينما تحقق نماذجنا MMOS أداءً متفوقًا على مستوى الحالة الحالية (SOTA) على سلسلة من النماذج الأساسية، وبتكلفة بناء أقل بكثير. بالإضافة إلى ذلك، نشير إلى أن مجموعة بيانات GSM-HARD ليست صعبة فعلاً، وأن النماذج اللغوية الكبيرة الحالية لم تعد تعاني من نقص في الموثوقية العددية. كما نقدّم أداة توليد مشكلات تلقائية (Auto Problem Generator) لاختبار الموثوقية والتطبيقات التعليمية. يتوفر الكود والبيانات الخاصة بنا بشكل عام على الرابط: https://github.com/cyzhh/MMOS.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

Zui Chen Yezeng Chen Jiaqi Han Zhijie Huang Ji Qi Yi Zhou

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Zui Chen Yezeng Chen Jiaqi Han Zhijie Huang Ji Qi Yi Zhou

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Zui Chen Yezeng Chen Jiaqi Han Zhijie Huang Ji Qi Yi Zhou

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

دراسة تجريبية لحدود القدرة على المعالجة في نماذج لغة كبيرة (LLMs) عند التفكير الرياضي

Zui Chen Yezeng Chen Jiaqi Han Zhijie Huang Ji Qi Yi Zhou

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

دراسة تجريبية لحدود القدرة على المعالجة في نماذج لغة كبيرة (LLMs) عند التفكير الرياضي

Zui Chen Yezeng Chen Jiaqi Han Zhijie Huang Ji Qi Yi Zhou

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

دراسة تجريبية لحدود القدرة على المعالجة في نماذج لغة كبيرة (LLMs) عند التفكير الرياضي

Zui Chen Yezeng Chen Jiaqi Han Zhijie Huang Ji Qi Yi Zhou

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters