Command Palette
Search for a command to run...
عندما تعطيك الحياة عينات: فوائد زيادة حجم الاستدلال الحاسوبي للنماذج اللغوية متعددة اللغات
Ammar Khairi Daniel Dsouza Ye Shen Julia Kreutzer Sara Hooker

الملخص
التطورات الحديثة في نماذج اللغات الكبيرة (LLMs) أعادت التركيز إلى زيادة الحوسبة في وقت الاستدلال، مما يحسن الأداء دون إعادة تدريب النموذج. من الأساليب الشائعة جمع مخرجات متعددة بشكل متوازي واختيار واحدة منها كمخرج نهائي. ومع ذلك، فإن الأعمال التي تم إنجازها حتى الآن ركزت على اللغة الإنجليزية وبضعة مجالات مثل الرياضيات والبرمجة. بخلاف ذلك، نحن مهتمون بشكل خاص بالتقنيات التي يمكن تعميمها على المهام المفتوحة، والمهمات القابلة للتحقق رسميًا، وعلى مختلف اللغات. في هذا البحث، ندرس كيفية توسيع نطاق الحوسبة في وقت الاستدلال بشكل ثابت للمهام التوليدية المفتوحة في إعداد متعدد اللغات والمهام.نتائجنا تظهر أن استراتيجيات العينة المستندة إلى تباين درجة الحرارة واستراتيجيات الاختيار يجب تعديلها لأخذ التنوع في المجالات والإعدادات اللغوية المختلفة بعين الاعتبار. قمنا بتقييم طرق الاختيار الموجودة وكشفنا أن الاستراتيجيات الفعالة في اللغة الإنجليزية غالبًا ما تفشل في التعميم عبر اللغات. نقترح استراتيجيات عينة واختيار جديدة تم تكييفها خصيصًا لمواقف الاستدلال المتعددة اللغات والمهام، ونوضح أنها تحقق مكاسب ملحوظة عبر اللغات والمهام. وبشكل خاص، أدت طرق العينة والاستدلال المدمجة لدينا إلى زيادة متوسطة بلغت +6.8 نقطة في معدلات الفوز لنماذجنا البالغ حجمها 8 مليارات معامل على دفعات m-ArenaHard-v2.0، مقابل النماذج الخاصة مثل جيمني (Gemini). وفي نطاق أكبر، أظهر النموذج Command-A (111 مليار معامل) مجهز بطرقنا زيادة بمعدل +9.0 نقطة في معدلات الفوز على نفس المعيار باستخدام خمس عينات فقط مقابل فك الترميز بنموذج عينة واحدة، وهي زيادة كبيرة بأقل التكاليف. تؤكد نتائجنا الحاجة إلى أساليب واعية للغة والمهام عند التعامل مع الحوسبة في وقت الاستدلال، بهدف تحقيق الديمقراطية في تحسين الأداء باللغات غير المعروفة بشكل كافٍ.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.