Command Palette
Search for a command to run...

الملخص
نقدّم نموذج Apriel-1.5-15B-Thinker، وهو نموذج متعدد الوسائط للتفكير بقدرة 15 مليار معلمة، يحقق أداءً من المستوى الرائد من خلال تصميم التدريب وليس فقط من خلال الحجم الكبير. بدءًا من نموذج Pixtral-12B، نطبّق منهجية متدرجة على ثلاث مراحل: (1) تضخيم العمق لتوسيع القدرة على التفكير دون الحاجة إلى تدريب من الصفر، (2) تدريب مُستمر منظم يبدأ ببناء فهم أساسي للنصوص والرؤية، ثم يُعزّز التفكير البصري من خلال إنشاء بيانات اصطناعية موجهة تتناول الهيكل المكاني، والفهم التكويني، والتمييز الدقيق، وأخيرًا (3) التدرّب المُوجّه عالي الجودة على بيانات نصية فقط باستخدام أزواج تعليمية مُختارة بعناية، تتضمّن آثارًا صريحة للتفكير في مجالات الرياضيات والبرمجة والعلوم واستخدام الأدوات. من الجدير بالذكر أن النموذج يحقق نتائج تنافسية دون استخدام التعلم بالتعزيز (reinforcement learning) أو تحسين التفضيلات، مما يعزل مساهمة منهجنا المبني على التدريب المستمر المركّز حول البيانات. وعلى مؤشر الذكاء الاصطناعي التحليلي (Artificial Analysis Intelligence Index)، حقق نموذج Apriel-1.5-15B-Thinker درجة قدرها 52، مُعادلًا أداء DeepSeek-R1-0528، مع استهلاك موارد حوسبة أقل بكثير. وفي عشرة معايير تقييم صورية، يُظهر الأداء متوسطًا ضمن خمس نقاط فقط من نموذج Gemini-2.5-Flash و Claude Sonnet-3.7، وهي إنجاز مهم لنموذج يعمل ضمن قيود النشر على وحدة معالجة واحدة (single-GPU). تُظهر نتائجنا أن التصميم الذكي لمرحلة التدريب المتوسطة يمكن أن يُغلق فجوات كبيرة في الأداء دون الحاجة إلى مقياس ضخم، مما يجعل التفكير متعدد الوسائط من المستوى الرائد متاحًا لمنظمات تمتلك بنية تحتية محدودة. ونُطلق نسخة النموذج (checkpoint)، وجميع وصفات التدريب، وبروتوكولات التقييم، تحت ترخيص MIT، لتعزيز البحث المفتوح المصدر.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.