MiniMax يطور موكلات ذكية على منصات NVIDIA
أعلنت شركة MiniMax عن إطلاق نموذج الذكاء الاصطناعي M2.7، وهو تحديث متقدم لنموذج M2.5 المصمم خصيصًا لمهام الوكلاء الآليين والتطبيقات المعقدة في مجالات مثل البحث العلمي وهندسة البرمجيات والمهام المكتبية. تتوفر نسخ الأوزان المفتوحة من النموذج الآن عبر منصة NVIDIA وشبكة التضمين مفتوحة المصدر، مما يسهل على المطورين تبنيه. يعتمد عائلة نماذج MiniMax M2 على بنية "المزيج النادر للخبراء" (Sparse Mixture-of-Experts) لتحقيق التوازن بين الكفاءة والقدرات المتقدمة. يسمح هذا التصميم بتكلفة استنتاج منخفضة مع الحفاظ على السعة الكاملة لنموذج مكون من 230 مليار معامل. يعمل النموذج عبر تفعيل 10 مليار معامل نشط فقط لكل مدخل من إجمالي المعاملات، مع وجود 256 خبيرًا محليًا يتم تفعيل 8 منها لكل رمز. تشمل التحسينات المعمارية استخدام الانتباه الذاتي السببي متعدد الرؤوس مع تقنيات التضمين والمعايرة لضمان تدريب مستقر على نطاق واسع. تم ضبط هذه الهندسة لتتفوق في حل التحديات البرمجية والمهام المعقدة التي تتطلب تفكيرًا عميقًا. في سياق التشغيل طويل الأمد للوكلاء الآليين، قدمت NVIDIA إطار عمل NemoClaw كمكتبة مرجعية مفتوحة المصدر لتبسيط تشغيل مساعدي OpenClaw المستمرين بأمان. يتيح هذا الإطار تثبيت بيئة تشغيل آمنة تسمى NVIDIA OpenShell، مصممة لتشغيل وكلاء مستقلين باستخدام نماذج مفتوحة مثل M2.7. يمكن للمطورين الآن بدء التشغيل بأمر واحد على منصة Brev السحابية الخاصة بـ NVIDIA، حيث يتم إعداد البيئة وتشغيل النموذج فورًا. ولتحقيق أقصى أداء، تعاونت NVIDIA مع مجتمع المصادر المفتوحة لدمج نوى عالية الأداء في إطارات عمل vLLM و SGLang. تهدف هذه التحسينات تحديدًا إلى تلبية متطلبات المعمارية لنماذج MoE واسعة النطاق. أظهرت الاختبارات على وحدات معالجة الرسومات NVIDIA Blackwell Ultra زيادة في معدل الإنتاجية تصل إلى 2.5 مرة باستخدام vLLM، و2.7 مرة باستخدام SGLang خلال شهر واحد فقط، مع تحسين التوازن بين الإنتاجية وسرعة الاستجابة. تدعم عملية النشر عدة مسارات مرنة. يمكن للمستخدمين تجربة النموذج مجانًا عبر نقاط النهاية المعززة بوحدات معالجة الرسومات المضافة على موقع build.nvidia.com، أو توظيف خدمات الاستدلال المصغرة المحسنة والمعروفة بـ NVIDIA NIM، والتي يمكن نشرها محليًا أو عبر السحابة أو في بيئات هجينة. كما يوفر إطار عمل NVIDIA NeMo أدوات للتحديث اللاحق للنموذج (Post-training) واستخدام التعلم المعزز، مع توفر وصفات جاهزة ومنحنيات التحقق من الدقة. تغطي هذه الحلول دورة حياة كاملة من نشر البيانات المركزية في مراكز البيانات حتى التخصيص الدقيق للبيئة، مما يجعل دمج MiniMax M2.7 في التطبيقات الإنتاجية أمرًا ممكنًا بسهولة. يمكن للمهتمين بدء العمل فورًا من خلال صفحات النموذج على منصات Hugging Face وموقع NVIDIA الخاص بالمطورين.
