HyperAIHyperAI
منذ 18 أيام

Orca-Math: فتح الإمكانات المخزنة في SLMs في الرياضيات الابتدائية

Arindam Mitra, Hamed Khanpour, Corby Rosset, Ahmed Awadallah
Orca-Math: فتح الإمكانات المخزنة في SLMs في الرياضيات الابتدائية
الملخص

تم التعرف منذ فترة طويلة على حل المشكلات الرياضية النصية باعتبارها مهمة معقدة بالنسبة إلى النماذج اللغوية الصغيرة (SLMs). وافتُرض في دراسة حديثة أن الحجم الأدنى للنموذج اللازم لتحقيق دقة تزيد عن 80% على معيار GSM8K هو 34 مليار معلمة. ولتحقيق هذا المستوى من الأداء باستخدام نماذج أصغر، يُدرّب الباحثون غالبًا نماذج SLM على إنتاج كود بايثون، أو يستخدمون أدوات لتجنب الأخطاء الحسابية. بالإضافة إلى ذلك، يعتمدون على تقنية التجميع (ensembling)، حيث يتم دمج نتائج حتى 100 تشغيل للنموذج للوصول إلى نتيجة أكثر دقة. وتتم عملية اختيار النتيجة النهائية باستخدام التوافق (consensus) أو التصويت الأغلبي، أو باستخدام نموذج مُحقِّق منفصل يعمل جنبًا إلى جنب مع النموذج اللغوي الصغير. ورغم أن التجميع يوفر تحسنًا كبيرًا في الدقة، فإنه يرافقه تكلفة كبيرة ناتجة عن الحاجة إلى استدعاء النموذج عدة مرات (مثلاً، يستخدم نموذج Phi-GSM الأعلى من 48 لرفع الأداء من 68.2 إلى 81.5).في هذا العمل، نقدم Orca-Math، وهو نموذج لغوي صغير بحجم 7 مليار معلمة، مبني على موديل Mistral-7B، ويحقق دقة 86.81% على معيار GSM8K دون الحاجة إلى استدعاء النموذج متعددة المرات، أو استخدام نماذج مُحقِّقة، أو تنفيذ كود، أو أي أدوات خارجية. يتميز نهجنا بعناصر رئيسية تشمل: (1) مجموعة بيانات اصطناعية عالية الجودة تتضمن 200 ألف مشكلة رياضية تم إنشاؤها باستخدام بيئة متعددة الوكلاء، حيث يعمل الوكلاء معًا لتكوين البيانات، (2) تقنية تعلّم تكراري تتيح للنموذج الصغير ممارسة حل المشكلات، واستلام ملاحظات حول حلوله، والتعلّم من أزواج تفضيلات تضم حلول النموذج والملاحظات المرافقة لها. عند تدريب Orca-Math باستخدام التدريب المُراقب فقط، يحقق أداءً بنسبة 81.50% على معيار GSM8K (pass@1). أما عند استخدام التعلّم التكراري المبني على التفضيلات، فيصل إلى دقة 86.81% (pass@1). ويتفوق Orca-Math في الأداء على نماذج أكبر بكثير مثل LLAMA-2-70B، وWizardMath-70B، وGemini-Pro، وChatGPT-3.5. كما يتفوق بشكل كبير على النماذج الصغيرة الأخرى، مع استخدام كمية بيانات أصغر بكثير (مئات الآلاف مقابل ملايين المشكلات).

Orca-Math: فتح الإمكانات المخزنة في SLMs في الرياضيات الابتدائية | أحدث الأوراق البحثية | HyperAI