HyperAIHyperAI

Command Palette

Search for a command to run...

NVIDIA بلكويل تتصدر كل فئات MLPerf 6.0 للتدريب

حققت منصة نفيديا بلويفيل تفوقاً شاملاً في معايير MLPerf Training v6.0، حيث تصدرت جميع الفئات المعتمدة من اتحاد MLCommons. وقد أثبتت النتائج التفوق التقني للمنصة في زمن التدريب السريع، وكفاءة الأداء لكل معجل، مع كونها المنصة الوحيدة التي قدمت نتائج في جميع الاختبارات السبعة. وقد أدخل هذا الإصدار الجديد مهام تدريب معززة تعتمد على هندسة المختلطة من الخبراء، بما في ذلك نموذج DeepSeek-V3 الضخم المكون من 671 مليار معلمة، ونموذج GPT-OSS-20B، حيث هيمنت حلول نفيديا على الأداء في كلا السيناريوهين. تميزت النتائج بسجل قياسي في النطاق واسع النطاق، حيث عملت العناقيد المكونة من 8192 معالج GPU من طراز GB200 وGB300 NVL72 بتناغم كامل عبر مراكز بيانات السحابة العالمية. وبفضل بنية NVLink ومفاتيح التبديل من الجيل الخامس، تعمل الوحدات المتصلة كوحدة حاسوبية موحدة، مما يقلل بشكل جذري من عنق الزجاجة في عمليات الاتصال ثنائية الاتجاه الضرورية لنماذج المختلطة من الخبراء. كما أظهرت منصة GB300 NVL72 الجديدة ترقية في الأداء تصل إلى 1.6 مرة مقارنة بنظيرتها GB200 NVL72، مدعومة بسعة ذاكرة موسعة، وكثافة حوسبية أعلى، وسقف طاقة متين يدعم أداء الذروة المستدام. يعود هذا التفوق إلى تعاون وثيق ومستمر بين العتاد والبرمجيات، حيث طورت نفيديا تحسينات متقدمة مثل رسوميات CUDA عبر التكرار الكامل لدعم النماذج المعقدة، وتقنية CuTe DSL لدمج النوى الحسابية وتقليل حركة البيانات غير الضرورية، بالإضافة إلى دقة MXFP8 لعمليات الانتباه التي تعزز السرعة دون المساس بالدقة الرقمية. وساهمت بروتوكولات الشبكة مثل Spectrum-X Ethernet في الحفاظ على كفاءة النطاق الترددي عبر توجيه البيانات المتفجر باستخدام التوجيه المتكيف المتقدم، مما يخفي تأخيرات الاتصال وراء عمليات الحوسبة. على صعيد الموثوقية والإنتاج، صممت نفيديا منظومة تعمل على منع الأعطال مسبقاً عبر فحوصات تصنيع دقيقة، ومراقبة ذاتية للشيب بواسطة محرك الموثوقية والتوافر، مع قدرة على إعادة التوجيه التلقائي للبيانات في حالة تعطل أي رابط في أقل من ميلي ثانية. كما قللت ميزة الاستعادة المرنة من وقت التوقف، مما يضمن استمرارية الجولات التدريبية التي تمتد لأسابيع. وقد أظهر الشركاء في النظام البيئي، بما في ذلك Microsoft Azure وGoogle Cloud وCoreWeave، نتائج ملموسة من هذه البنية، مثل تسريع تدريب نماذج Cohere بثلاثة أضعاف، وتسريع Thinking Machines Lab، وخفض Nebius لوقت التدريب بنسبة 30%. تؤكّد نتائج MLPerf Training v6.0 تحول منصة نفيديا بلويفيل إلى المعيار الصناعي المعتمد لتسريع تدريب النماذج التأسيسية والذكاء الاصطناعي المتقدم. من خلال الجمع بين السرعة الفائقة، النطاق الواسع، والموثوقية التشغيلية، توفر المنصة بنية تحتية قابلة للتوسع تنتقل بالابتكار من المختبرات إلى الإنتاج الضخم، مما يختصر دورات التدريب الشهور إلى دقائق ويحدد وتيرة الجيل القادم من تقنيات الذكاء الاصطناعي العالمي.

الروابط ذات الصلة