HyperAI

فشل سعر السهم في التوقف عن الانخفاض. كشف هوانغ رينكسون عن موعد إطلاق بلاكويل ألترا وفيرا روبين، وأصبحت القدرة على التفكير هي محور الاهتمام

特色图像

في السنوات الأخيرة، كانت شركة NVIDIA حاضرة في كل اتجاه رئيسي تقريبًا في مجال التكنولوجيا العالمي، من الحوسبة السحابية إلى العملات المشفرة، ومن metaverse إلى الذكاء الاصطناعي. وخاصة في الموجة الجديدة من الذكاء الاصطناعي، تسيطر شركة NVIDIA، مع تراكمها التكنولوجي العميق، بقوة على حصة سوق وحدة معالجة الرسومات في مراكز البيانات والتي تبلغ حوالي 95%، لتصبح بذلك الرائدة المطلقة في مجال شرائح الذكاء الاصطناعي.

ومع ذلك، في وقت سابق من هذا العام،ديب سيك  لقد أرسل ظهور نماذج الاستدلال إشارة واضحة إلى الجمهور: إن نموذج "الجهد الكبير لتحقيق المعجزات" الذي اعتمد على تكديس البيانات وقوة الحوسبة في الماضي أصبح غير فعال تدريجيا. وقد أدى هذا إلى اهتزاز توقعات السوق بشأن آفاق قوة الحوسبة التي تعتمد على الذكاء الاصطناعي، كما انخفضت أسعار أسهم العديد من شركات التكنولوجيا العملاقة، بما في ذلك شركة إنفيديا، بشكل حاد. وعلى الرغم من تعافي سعر سهم إنفيديا منذ ذلك الحين، فإن هيمنتها في الصناعة لم تعد غير قابلة للكسر كما كانت في السابق. من أجل إثبات قوة الشركة، سيتعين على Nvidia ترقية وتحديث وحدة معالجة الرسوميات الخاصة بها بشكل شامل.

في مؤتمر GTC 2025 الذي عقد في الساعة 1 صباحًا بتوقيت بكين يوم 19 مارس، قدم هوانغ رينكسون أحدث الأخبار حول شرائح Nvidia:من المقرر إطلاق النسخة المطورة من بنية شريحة الذكاء الاصطناعي Blackwell، Blackwell Ultra، في النصف الثاني من هذا العام. ستعمل كل من NVIDIA GB300 NVL72 وNVIDIA HGX™ B300 NVL16 على تعزيز قدرات التفكير النموذجي بشكل شامل. ستتوفر معمارية GPU من الجيل التالي من NVIDIA Vera Rubin في العام المقبل.

NVIDIA Blackwell Ultra يُسرّع استدلال الذكاء الاصطناعي

في مؤتمر GTC العام الماضي، أعلن هوانج رينكسون عن بنية شريحة الذكاء الاصطناعي من الجيل التالي من بلاكويل. هوبر  يعد Blackwell خليفة وحدة معالجة الرسوميات GeForce من NVIDIA، ويحتوي على 208 مليار ترانزستور ويركز على تسريع مهام الذكاء الاصطناعي التوليدي والتدريب واسع النطاق وأحمال العمل الاستدلالية. أعلن هوانغ رينكسون بفخر في خطابه أن هذه هي أقوى سلسلة شرائح الذكاء الاصطناعي حتى الآن.

في البث المباشر اليوم، ذكر هوانغ رينكسون بلاكويل مرة أخرى.وقال: "إن مزايا بلاكويل هي أنه أسرع، وأكبر حجماً، ويحتوي على عدد أكبر من الترانزستورات، كما يتمتع بقوة حوسبة أقوى". علاوة على ذلك، فإن بنية NVL 72 + نموذج دقة الحوسبة FP4 الذي يتبناه يعمل أيضًا على تحسين أداء Blackwell بشكل أكبر، مما يعني أنه يمكننا إكمال نفس مهام الحوسبة مع استهلاك أقل للطاقة.

ومن الجدير بالذكر أنه بعد ظهور DeepSeek، تحول التركيز في سوق الذكاء الاصطناعي تدريجيًا من "التدريب" إلى "الاستدلال". في هذا المؤتمر، استشهد هوانج رينكسون على وجه التحديد بحالة نموذج استدلالي لإثبات تفوق أداء بلاكويل في الحوسبة - 40 مرة أعلى من هوبر. "لقد قلت هذا من قبل، إذا بدأت شركة بلاكويل في شحنها بكميات كبيرة، فلن تتمكن حتى من طرح هوبر في السوق." وبطبيعة الحال، ذكر هوانغ رينكسون أيضًا أن شركة Blackwell تستثمر بشكل كامل في الإنتاج، وسيتم ترقية مصنع NVIDIA Blackwell AI مرة أخرى في النصف الثاني من هذا العام.والانتقال بسلاسة إلى Blackwell Ultra.

سيتضمن Blackwell Ultra حل NVIDIA GB300 NVL72 على نطاق الرف، و بطاقة الرسومات NVIDIA HGX B300 NVL16  نظام.

أولاً، يستخدم NVIDIA GB300 NVL72 تصميمًا مثبتًا على الرف مبردًا بالسائل بالكامل ويحتوي على 72 وحدة معالجة رسومية NVIDIA Blackwell Ultra و36 وحدة معالجة رسومية NVIDIA تعتمد على Arm وحدة المعالجة المركزية Grace™  التكامل في منصة واحدة مُحسّنة لاستدلال التوسع في وقت الاختبار. بالمقارنة مع الجيل السابق من NVIDIA GB200 NVL72، فإن GB300 NVL72 يتمتع بأداء الذكاء الاصطناعي بمقدار 1.5 مرة، ويمكنه استكشاف حلول متعددة، وتقسيم المهام المعقدة إلى خطوات متعددة لتوليد استجابات ذات جودة أعلى.

ثانيًا، توفر NVIDIA HGX B300 NVL16 نقلة نوعية في معالجة المهام المعقدة مثل التفكير بالذكاء الاصطناعي بكفاءة. وبالمقارنة مع Hopper، فإنه يزيد سرعة التفكير في نماذج اللغة الكبيرة بمقدار 11 مرة، ويزيد قوة الحوسبة بمقدار 7 مرات، ويزيد سعة الذاكرة بمقدار 4 مرات.

باختصار، يعمل Blackwell Ultra على تعزيز الاستدلال الموسع في وقت التدريب والاختبار، مما يوفر دعمًا قويًا للتطبيقات مثل التفكير المتسارع بالذكاء الاصطناعي، ووكيل الذكاء الاصطناعي، والذكاء الاصطناعي المادي.

في هذا الصدد، قال هوانغ رينكسون: "لقد حققت تكنولوجيا الذكاء الاصطناعي تقدمًا هائلاً، وزاد الطلب على أداء الحوسبة لوكلاء الذكاء الاصطناعي ووكلاء التفكير بشكل ملحوظ. ولتحقيق ذلك، صممنا بلاكويل ألترا، وهي منصة متعددة الوظائف قادرة على أداء مهام ما قبل التدريب وما بعده ومهام التفكير بكفاءة."

هندسة وحدة معالجة الرسومات من الجيل التالي من Nvidia - فيرا روبين

لقد قامت شركة Nvidia بتسمية بنيتها بأسماء العلماء منذ عام 1998، وهذه المرة ليست استثناءً.تم تسمية معمارية وحدة معالجة الرسوميات من الجيل التالي من Nvidia، Vera Rubin، على اسم فيرا روبين، عالمة الفلك الأمريكية التي اكتشفت المادة المظلمة.

فيرا روبين

قامت فيرا روبين بدمج بنية وحدة المعالجة المركزية ووحدة معالجة الرسومات التي طورتها بنفسها بشكل عميق لأول مرة.ويمثل هذا إنجازًا آخر لشركة NVIDIA في هندسة الحوسبة بالذكاء الاصطناعي، مما يؤدي إلى توسيع حدود أداء الحوسبة بالذكاء الاصطناعي بشكل أكبر.

"في الأساس، كل شيء جديد باستثناء الهيكل"، كما قال هوانج رينكسون. باعتبارها أول بنية وحدة معالجة مركزية مصممة بشكل مستقل بالكامل من NVIDIA، تم بناء Vera على نواة Arm مخصصة. إنه عبارة عن وحدة معالجة مركزية صغيرة بقدرة 50 وات فقط، ولكنها تتمتع بذاكرة أكبر ونطاق ترددي أعلى. وفقًا للبيانات الرسمية من NVIDIA، تم زيادة أداء الحوسبة في Vera بشكل مباشر بمقدار 2 مرات مقارنةً بـ Grace Blackwell. بالإضافة إلى ذلك، تم تحسينه بشكل كبير أيضًا لأحمال الذكاء الاصطناعي. من خلال تحسين مجموعة التعليمات، يتم تقليل زمن انتقال الاتصالات بشكل كبير، مما يجعل معالجة البيانات أكثر كفاءة وسلاسة، مما يوفر دعمًا قويًا لتدريب الذكاء الاصطناعي والتفكير المنطقي.

وفي الوقت نفسه، تعمل وحدة معالجة الرسوميات الجديدة Rubin أيضًا على تحقيق قفزة أخرى إلى الأمام في مجال الحوسبة القائمة على الذكاء الاصطناعي. عند التشغيل باستخدام Vera، يمكن للحوسبة الاستدلالية Rubin تحقيق 50 بيتافلوب، أي أكثر من ضعف أداء وحدات معالجة الرسوميات Blackwell الحالية. بالإضافة إلى ذلك، يدعم Rubin أيضًا ما يصل إلى 288 جيجابايت من الذاكرة عالية السرعة، مما يضمن أن تدريب الذكاء الاصطناعي والتفكير المنطقي يمكنهما معالجة كميات هائلة من البيانات بكفاءة.

وكشف هوانج رينكسون أيضًا أن Vera Rubin NVL144 سيكون متاحًا في النصف الثاني من العام المقبل.وتتوقع شركة NVIDIA إطلاق Vera Rubin Ultra في النصف الثاني من عام 2027، والذي يستخدم تقنية NVL576 ويتكون من 2.5 مليون مكون. يتمتع كل رف بقوة تصل إلى 600 كيلووات. سيزداد عدد عمليات النقطة العائمة بمقدار 14 مرة إلى 15 إكسافلوب، مما يحقق قابلية التوسع القصوى.

من جريس هوبر إلى بلاكويل والآن إلى روبين، أظهر لنا هوانج رينكسون قفزات NVIDIA الهائلة في أداء الحوسبة وتحسين التكلفة.وبالمقارنة بقوة الحوسبة المعيارية، فإن عمليات النقطة العائمة الموسعة رأسياً في Hopper هي 1 مرة من المعيار، ويزيدها Blackwell إلى 68 مرة، ويقفز Rubin إلى 900 مرة، محققاً نمواً هائلاً. لا يؤدي هذا الاختراق إلى تقليل تكلفة وحدة الحوسبة القائمة على الذكاء الاصطناعي بشكل كبير فحسب، بل يجعل أيضًا تدريب والتفكير في نماذج الذكاء الاصطناعي الأكثر تعقيدًا وواسعة النطاق فعالًا وممكنًا.

ستوفر شركة Nvidia خدمات متكاملة لبناء مصانع الذكاء الاصطناعي

في السنوات الأخيرة، تحول التركيز في مجال الذكاء الاصطناعي تدريجيًا من تدريب النماذج الكبيرة إلى التطبيق الواسع النطاق لنماذج الاستدلال. لقد أصبح الاستدلال القوة الدافعة الأساسية للنمو السريع لاقتصاد الذكاء الاصطناعي. لا يؤدي هذا التحول إلى تغيير المشهد التكنولوجي فحسب، بل يفرض أيضًا متطلبات جديدة للبنية الأساسية للحوسبة. لم يتم تصميم مراكز البيانات التقليدية لعصر الذكاء الاصطناعي الجديد. من أجل تعزيز التفكير في الذكاء الاصطناعي ونشره بكفاءة، تعمل مصانع الذكاء الاصطناعي (مصانع الذكاء الاصطناعي) جاءت إلى الوجود.

لا تقوم مصانع الذكاء الاصطناعي بتخزين البيانات ومعالجتها فحسب، بل تقوم أيضًا "بإنتاج الذكاء" على نطاق واسع، وتحويل البيانات الخام إلى رؤى في الوقت الفعلي. وقالت شركة NVIDIA: "إن الاستثمار في الشركات المتخصصة في بناء مصانع الذكاء الاصطناعي سوف يتولى زمام المبادرة في السوق المستقبلية".

لدعم هذا التحول، أنشأت NVIDIA اللبنات الأساسية لمصانع الذكاء الاصطناعي الكاملة وتوفر للشركاء المكونات الرئيسية التالية: رقائق الحوسبة عالية الأداء، وتقنيات الشبكات المتقدمة، وإدارة البنية التحتية وتنسيق أحمال العمل، وأكبر نظام بيئي لاستنتاج الذكاء الاصطناعي، ومنصات التخزين والبيانات، ومخططات التصميم والتحسين، والهندسة المعمارية المرجعية، وطرق النشر المرنة.

ليس هناك شك في أن قوة الحوسبة هي الركيزة الأساسية لمصانع الذكاء الاصطناعي. من هندسة Hopper إلى هندسة Blackwell، تقدم NVIDIA أقوى الحوسبة المتسارعة في العالم. من خلال حل مستوى الرف GB300 NVL72 المستند إلى Blackwell Ultra، يمكن لمصانع الذكاء الاصطناعي تحقيق ما يصل إلى 50 ضعفًا من ناتج استنتاج الذكاء الاصطناعي وتوفير دعم أداء غير مسبوق لمعالجة المهام المعقدة.