MiniMax-M2.5: النموذج الحدودي بسعر دولار واحد في الساعة يُحدث ثورة في كفاءة الذكاء الاصطناعي
في 12 فبراير 2026، أطلقت شركة مينيماك الشهيرة بشرائح الذكاء الاصطناعي في هونغ كونغ نموذجها الجديد M2.5، الذي يُعد خطوة متقدمة في سباق النماذج المتقدمة. يُظهر النموذج أداءً متميزًا في المعايير الحاسوبية، حيث حقق 80.2% في SWE-Bench Verified، و51.3% في Multi-SWE-Bench (أفضل من كل المنافسين)، و76.3% في BrowseComp، مقارنةً بنماذج مثل Claude Opus 4.6 وGPT-5.2. ما يلفت الانتباه هو سعره المذهل: حوالي دولار واحد لكل ساعة تشغيل مستمر بسرعة 100 رمز في الثانية. M2.5 هو تطوير لسلسلة M2 التي تم إطلاقها في أواخر أكتوبر 2025، ويحافظ على نفس البنية المعمارية: نموذج مختلط من الخبراء (MoE) بحجم 230 مليار معلمة، مع 10 مليار معلمة نشطة في كل عملية تنبؤ. هذا العدد الصغير من المعلمات النشطة يجعل النموذج قابلاً للتشغيل المحلي بسهولة، باستخدام أدوات مثل vLLM أو SGLang، رغم قوته الكبيرة. يُقدَّم النموذج بنسختين: Lightning (أعلى أداءً بسرعة تضاعف النماذج الأخرى)، وStandard (أرخص بشكل كبير). مقارنةً بأسعار المنافسين، مثل Claude Opus 4.6 التي تبلغ 5 دولارات لكل مليون رمز مدخل و25 لكل مخرج، أو GLM-5 التي تُحسب بـ1 و3.20 دولارات، فإن M2.5 يُعد خيارًا اقتصاديًا ممتازًا. من الناحية التقنية، يعتمد النموذج على منهجية تدريب مبتكرة تُسمى "Forge"، وهي إطار تعلم تعزيزي مُصمم خصيصًا للنماذج العاملة كوكلاء. يُفصل Forge بين محرك التدريب والهيكل الداعم للوكلاء، مما يسمح للنموذج بالتعلم على مئات الهياكل المختلفة دون التخصيص لواحدة منها. تم تدريب النموذج على أكثر من 200 ألف بيئة حقيقية، تشمل مهام داخلية في الشركة نفسها. أبرز ابتكارات Forge تشمل: - CISPO: خوارزمية تعلم تعزيزي مخصصة تُحسّن التقديرات دون قطع التحديثات، وتحقق تسريعًا بنسبة 2x مقارنة بخوارزميات أخرى. - التخطيط غير المتزامن ودمج العينات الشجري: يزيد من استخدام وحدات المعالجة الرسومية بنسبة 40x. - مكافآت على مستوى العملية: تُستخدم لتقدير جودة التوليد ووقت إنجاز المهام، مما يدفع النموذج نحو الحلول الأسرع. أظهر النموذج تطورًا ملحوظًا في المهام متعددة الدورات، حيث حقق 76.8% في المهام متعددة المرات من خلال استدعاء الوظائف، متفوقًا بـ13 نقطة على Opus 4.6. كما أظهرت تقييمات OpenHands أن M2.5 يُصنف رابعًا عالميًا، خلف فقط Opus 4.6 وOpus 4.5 وGPT-5.2 Codex، ويتفوق في المهام الطويلة مثل بناء تطبيقات من الصفر. ملاحظة مهمة: النموذج يظهر سلوكًا تلقائيًا في التخطيط قبل الكتابة، مما يقلل من عدد الرموز المستخدمة (3.52 مليون مقابل 3.72 مليون في M2.1)، ويقلل الأخطاء. كما يُظهر قدرة قوية في معالجة مستندات المكتب (Word، Excel، PowerPoint)، وفقًا لاختبارات داخلية تُظهر فوزه بنسبة 59% ضد النماذج الأخرى. على الرغم من أن الأداء لا يزال غير متسق تمامًا في بعض الحالات (مثل إرسال فروع خاطئة أو تجاهل تعليمات التنسيق)، إلا أن النموذج يُظهر طريقًا واعدًا نحو نماذج فعالة من حيث التكلفة وذات أداء عالٍ. مينيماك وعدت بنشر تفاصيل تقنية حول إطار Forge وقوانين التوسع في التعلم التعزيزي، وهو ما يثير اهتمامًا واسعًا في المجتمع العلمي.
