HyperAIHyperAI

Command Palette

Search for a command to run...

إطلاق NVIDIA نموذج Llama 3.1 متعدد الوسائط لدعم الحوسبة السحابية

تتحول تطبيقات الذكاء الاصطناعي من توليد النصوص فقط إلى أنظمة متعددة الوسائط قادرة على رؤية المستندات والصور والفيديوهات وتحليلها في الوقت الفعلي. وفي هذا السياق، أطلقت شركة ستيفان نموذج Step 3.7 Flash، وهو نموذج متخصص للعمل على البنية التحتية المعجلة بوحدات معالجة رسومات نفيديا. يهدف هذا النموذج إلى تمكين المؤسسات من استخدام قدرات متقدمة في البحث والاستدلال المعقد عبر البيانات الضخمة. يعتبر Step 3.7 Flash نموذجًا متعدد التخصصات يعتمد على بنية "خليط الخبراء" بـ 198 مليار معلمة إجمالية، حيث يتم تنشيط حوالي 11 مليار معلمة فقط في كل عملية حسابية لضمان الكفاءة. يتميز النموذج بدعمه المدفوع للصور والفيديو كمدخلات، مع نافذة سياق تبلغ 256 ألف رمز، مما يسمح بتحليل وثائق شديدة الطول. كما يتوفر بثلاث مستويات قابلة للتخصيص للاستدلال (منخفض ومتوسط وعالي) لتلبية احتياجات تطبيقات الأعمال المختلفة مثل التحليل المالي أو كتابة الأكواد البرمجية المتزامنة. لتحقيق أقصى أداء، توفر ستيفان نسخًا مضغوطة من النموذج بتقنية NVFP4، مما يقلل من متطلبات الذاكرة وعرض النطاق الترددي ويسرع الاستدلال. يمكن للمطورين نشر هذا النموذج باستخدام أطر عمل مفتوحة المصدر مثل SGLang وvLLM وTensorRT-LLM، والتي تتميز بمحركات محسنة لعتاد نفيديا. كما تتيح المنصة نفيديا نقاط نهاية معجلة بوحدات المعالجة الرسومية لتجربة النموذج وتقييمه، خاصة في سيناريوهات استخراج البنية الهيكلية من التقارير المالية والعروض التقديمية. تسهل نفيديا عملية الانتقال من التطوير إلى الإنتاج من خلال خدمة NIM، وهي خدمات استدلال دقيقة قابلة للتعبئة، توفر واجهات برمجية موحدة وأمانًا عاليًا يمكن تشغيلها على الخوادم المحلية أو السحابية. بالإضافة إلى ذلك، يوفر إطار عمل نيمو نفيديا أدوات لضبط النموذج المبدئي "Day 0" باستخدام بيانات خاصة بالمنطقة، مما يسمح بالتحسين المباشر على وحدات Hopper بأداء عالٍ. تتنوع خيارات النشر لتشمل مراكز البيانات المزودة بوحدات Blackwell، أو محطات العمل المصممة للمطورين مثل DGX Station التي توفر ذاكرة توحيد ضخمة للتعامل مع السياق الطويل. تؤكد نفيديا التزامها بالنماذج مفتوحة المصدر لتعزيز الشفافية والأمان في الذكاء الاصطناعي، وتوفر موارد شاملة للمطورين للبدء في تجربة النموذج عبر منصات مثل Hugging Face أو عبر كتب اللعب المتاحة على GitHub.

الروابط ذات الصلة