نيفيديا بل랙ويل يتفوق في اختبارات الأداء والاستفادة من الذكاء الاصطناعي
تحول الذكاء الاصطناعي من الإجابات الفردية إلى عمليات استنتاج معقدة تُستهلك كميات هائلة من الحوسبة، ما يرفع من أهمية الكفاءة الاقتصادية في تشغيل النماذج. أطلقت شركة SemiAnalysis منصة InferenceMAX v1، أول معيار مفتوح المصدر يقيس التكلفة الإجمالية للحوسبة في سيناريوهات واقعية، وظهرت نتائجها بوضوح أن منصة NVIDIA Blackwell تتفوق في الأداء والكفاءة. فنظام GB200 NVL72 الذي استثمر فيه 5 ملايين دولار يمكنه تحقيق عائد قدره 75 مليون دولار من إيرادات الرموز، أي عائد استثماري قدره 15 مرة، ما يعكس اقتصاديات جديدة للتشغيل على نطاق واسع. يؤكد إيان باك، نائب رئيس الحوسبة الضخمة في NVIDIA، أن الاستنتاج هو المكان الذي يُدرّب فيه الذكاء الاصطناعي قيمته يومياً، وأن النهج الشامل لـ NVIDIA يوفر الأداء والكفاءة الضرورية لتوسيع استخدام الذكاء الاصطناعي. تُقيّم InferenceMAX v1 نماذج شهيرة مثل gpt-oss-120b وLlama 3.3 70B وDeepSeek-R1 عبر منصات متعددة، مع تغطية لسيناريوهات متعددة من المحادثة والتحليل والتفكير المعقد، وتم نشر النتائج بشكل شفاف وقابل للتكرار. النتائج تُظهر أن Blackwell تحقق تقدماً بنسبة 15 مرة في الأداء مقارنة بجيل Hopper، بفضل تصميم هاردوير وبرمجيات متكامل. تشمل الميزات الرئيسية نواة FP4 المدعومة بشكل أصلي، وربط NVLink الجيل الخامس بسرعة 1800 جيجابايت في الثانية، وذاكرة HBM3e، ما يضاعف كفاءة الحوسبة بالواط ويقلل التكلفة لكل مليون رمز بنسبة 15 مرة. هذا يُحدث تحولاً جذرياً في تكلفة التشغيل، خاصة في مصانع الذكاء الاصطناعي التي تُدار ضمن قيود الطاقة. التحسينات البرمجية المستمرة تُسهم بشكل كبير في هذه النتائج. فمع تطوير TensorRT-LLM إلى الإصدار 1.0، ودمج تقنيات مثل التصريح التنبؤي (Speculative Decoding) في النموذج gpt-oss-120b-Eagle3-v2، تضاعف الأداء ثلاث مرات عند 100 رمز في الثانية لكل مستخدم، وارتفع الأداء لكل وحدة معالجة من 6000 إلى 30000 رمز في الثانية. كما تُحسّن تقنيات التوازي المتعددة مثل DEP وEP من خلال توزيع طبقات الانتباه والخبرات عبر وحدات معالجة متعددة، باستخدام مفاتيح NVLink Switch لتجنب التأخير. بالإضافة إلى ذلك، تُعزز الشراكات مع مشاريع مفتوحة المصدر مثل SGLang وvLLM وFlashInfer تطوير كيرنيلات مخصصة لتحسين الأداء في مهام التفكير والاتصال. كما يدعم نظام Dynamo التجزئة الموزعة بين مراحل التعبئة والتنفيذ، مما يُحسّن استخدام الذاكرة والموارد. وتحافظ منصة GB200 NVL72 على تكلفة منخفضة حتى عند ارتفاع التفاعل، ما يسمح بخدمة عدد أكبر من المستخدمين دون زيادة التكاليف. في النهاية، تُظهر InferenceMAX v1 أن منصة Blackwell لا تتفوق في نقطة واحدة فقط، بل في جميع معايير الأداء والكفاءة، مما يجعلها الخيار المثالي لمصانع الذكاء الاصطناعي التي تسعى لتحقيق أعلى عائد استثماري. مع تطوير بيئة مفتوحة وشفافة، تُعزز NVIDIA الابتكار الجماعي، وتُسهم في تسريع تطور الذكاء الاصطناعي على نطاق عالمي.
