HyperAI

GTC 2025: أكثر من مجرد رقائق، كشف جينسن هوانج عن العديد من الإنجازات الجديدة في مجال الذكاء الاصطناعي الفيزيائي في نصف ساعة، وكلها مفتوحة المصدر

特色图像

في يوم 18 مارس بتوقيت بكين، انطلقت فعاليات NVIDIA GTC 2025، والتي تمت ترقيتها إلى حدث لصناعة الذكاء الاصطناعي، ولكن ربما بسبب نقص المنتجات الرائجة،  لم ينجح المنتدى والمعرض غير المتصل بالإنترنت في اليوم الأول في عكس اتجاه انخفاض سعر سهم Nvidia.وكان هناك حتى انخفاض. ولذلك، فإن "الخطاب الرئيسي"، الذي حظي بالفعل بقدر كبير من الاهتمام، حظي بمزيد من الاهتمام والتوقعات.

من المؤكد أن التقلبات في سعر سهم إنفيديا لا ترتبط فقط بالتكهنات حول "انخفاض الطلب على قوة الحوسبة" الناجمة عن DeepSeek، ولكنها تتأثر أيضًا بدرجة أو بأخرى بتصحيح سوق الأسهم الأمريكية. ولكن مهما كان السبب، فإن هوانغ رينكسون، بصفته رئيس مجلس إدارة الشركة، يحتاج إلى استعادة ثقة المستثمرين في أقرب وقت ممكن. ولهذا السبب رأيناه يقول ما يلي في خطابه الذي استغرق قرابة ثلاث ساعات:

* تم ذكر قانون التدرج عدة مرات؛

* الانضمام إلى حركة المصدر المفتوح، وإصدار نموذج الاستدلال NVIDIA Llama Nemotron المبني على نموذج Llama؛

* وأشاد بأن بلاكويل دخلت مرحلة الإنتاج بكامل طاقتها، وأن "القدرة الإنتاجية تتزايد بسرعة مذهلة، والطلب من العملاء مثير للإعجاب أيضًا"؛

* التأكيد صراحة على أن "الجهد الحسابي" في مجال الذكاء الاصطناعي قد زاد بشكل كبير بسبب ظهور نماذج الاستدلال؛

* …

ولكن يبدو أن خطاب هوانغ العاطفي لم يكن له تأثير يذكر.حتى وقت نشر هذا التقرير، لا يزال سعر سهم Nvidia في اتجاه هبوطي.

بمعنى ما، يُظهر هذا أيضًا أن تحديثات الأجهزة والهندسة المعمارية التي تم تسريبها لم تحظَ بقدر كبير من التأييد من السوق. بالإضافة إلى بلاكويل ألترا وفيرا روبين،قد يكون الذكاء الاصطناعي المادي الذي شاركه هوانغ رينكسون في النصف ساعة الأخيرة "قصة جيدة" أخرى مناسبة للمشاركة المتعمقة مع المستثمرين والصناعة.

يلخص جينسن هوانج أهم ما جاء في بيان GTC 2025

انفجار من الإنجازات الجديدة في الذكاء الاصطناعي المادي في نصف ساعة

في معرض CES 2025، الذي افتتح في أوائل يناير 2025، أطلقت NVIDIA النموذج الأساسي العالمي Cosmos.صرح هوانغ رينكسون قائلاً: "إن الحدود التالية للذكاء الاصطناعي هي الفيزياء".لقد دفعت الذكاء الاصطناعي المادي إلى المرحلة الرئيسية من الذكاء الاصطناعي بضربة واحدة. يشير ما يسمى بالذكاء الاصطناعي المادي إلى تمكين الأنظمة المستقلة مثل الروبوتات والسيارات ذاتية القيادة والمساحات الذكية من إدراك وفهم وتنفيذ العمليات المعقدة في العالم الحقيقي.

في الصباح الباكر من يوم 19 مارس، وفي نهاية الخطاب الرئيسي، دفع ظهور الروبوت الصغير "بلو" الأجواء إلى ذروتها مع الهتافات المتواصلة. ويوضح التفاعل بين الطرفين أيضًا الخطوط العريضة للذكاء الاصطناعي المادي بالنسبة لنا.

صورة

بلو وجين هسون هوانغ على المسرح

في أقل من نصف ساعة الماضية، أصدر هوانغ رينكسون سلسلة مكثفة من الأخبار المثيرة.

الأول هو إطلاق مجموعة بيانات مفتوحة المصدر للذكاء الاصطناعي الفيزيائي.يوفر للمطورين 15 تيرابايت من البيانات، بما في ذلك آلاف الساعات من مقاطع الفيديو متعددة الكاميرات، وأكثر من 320 ألف مسار لتدريب الروبوت، وما يصل إلى 1000 وصف عام للمشهد (OpenUSD)، وهو يتفوق في التنوع والحجم والتغطية الجغرافية، وسيكون مفيدًا بشكل خاص في مجال أبحاث الأمن لأنه يمكنه تحديد القيم المتطرفة وتقييم أداء تعميم النموذج. ومن الجدير بالذكر أن NVIDIA صرحت رسميًا أن مجموعة البيانات ستستمر في التوسع بمرور الوقت وقد تصبح أكبر مجموعة بيانات موحدة مفتوحة المصدر للذكاء الاصطناعي الفيزيائي في العالم.

* عنوان تنزيل مجموعة البيانات:

https://go.hyper.ai/mkTKR

التالي هو أول نموذج أساسي مفتوح المصدر وقابل للتخصيص بالكامل في العالم، وهو NVIDIA Isaac GR00T N1.يستخدم لمحاكاة التفكير البشري والمهارات الأخرى. يتميز الطراز الأساسي GR00T N1 بهندسة نظام مزدوج مستوحاة من مبادئ الإدراك البشري. "النظام 1" هو نموذج عمل سريع التفكير يعكس ردود الفعل أو الحدس البشري المشروط. النظام 2 هو نموذج تفكير بطيء يستخدم لاتخاذ القرارات المدروسة والمنهجية.

والثالث هو إطلاق نيوتن، وهو محرك فيزيائي مفتوح المصدر لمحاكاة الروبوتات.سيتم تطويره بشكل مشترك من قبل NVIDIA وGoogle DeepMind وDisney Research، استنادًا إلى مكتبة تسريع NVIDIA CUDA-X NVIDIA Warp، مما يوفر للمطورين طريقة سهلة لكتابة برامج kernel معجلة بواسطة وحدة معالجة الرسومات لمحاكاة الذكاء الاصطناعي والروبوتات والتعلم الآلي (ML).

أخيرًا، تم تحديث نموذج قاعدة عالم Cosmos، مما أدى إلى تقديم نموذج تفكير مفتوح المصدر وقابل للتخصيص بالكامل.مُصمم خصيصًا لتطوير الذكاء الاصطناعي المادي. في،يتم استخدام Cosmos Transfer لتوليد البيانات الاصطناعية،ويستقبل مدخلات فيديو منظمة مثل خرائط التجزئة وخرائط العمق ومسح الليدار وخرائط تقدير الوضع وخرائط المسار لتوليد مخرجات فيديو واقعية يمكن التحكم فيها. كوزموس يتنبأ بجيل العالم الذكي،سيتم دعم إنشاء إطارات متعددة، والتنبؤ بالإجراءات الوسيطة أو مسارات الحركة بالنظر إلى صورة الإدخال الأولية والنهائية. يتم استخدام Cosmos Reason لتحسين كفاءة شرح بيانات الذكاء الاصطناعي وتنظيمها.تحسين نماذج العالم الحالية أو بناء نماذج عمل لغوية بصرية جديدة تمامًا.

من الحوسبة المتسارعة إلى العلوم المتسارعة

بالإضافة إلى الذكاء الاصطناعي المادي، يستمر تخطيط NVIDIA في مجال الذكاء الاصطناعي للعلوم في التعمق، وهو ما قد يصبح نقطة نمو جديدة في المستقبل.

ربما يمكن إرجاع علاقة NVIDIA بالذكاء الاصطناعي للعلوم إلى ولادة CUDA، والتي بدأت بالجمع القوي بين الحوسبة المتسارعة والحوسبة عالية الأداء (HPC). قال هوانغ رينكسون ذات مرة:منذ إنشاء CUDA، قامت NVIDIA بخفض تكلفة الحوسبة بمقدار مليون جزء من المليون من تكلفتها السابقة.بالنسبة لبعض الأشخاص، فإن NVIDIA عبارة عن مجهر حاسوبي يسمح لهم برؤية أصغر الأشياء؛ بالنسبة للآخرين، فهو عبارة عن تلسكوب يسمح لهم باستكشاف المجرات البعيدة بشكل لا يمكن تصوره؛ وبالنسبة للعديد من الناس، فهي بمثابة آلة الزمن التي تسمح لهم بمواصلة عمل حياتهم بينما لا يزال لديهم الوقت.

وبعبارة أخرى، فإن الجمع البيئي بين CUDA ووحدة معالجة الرسومات NVIDIA هو الذي أدى إلى تحسين قدرات الحوسبة المتوازية بشكل كبير وتسريع تطبيق الحوسبة عالية الأداء في مجال البحث العلمي. لقد ضخت الذكاء الاصطناعي اليوم زخمًا قويًا في صناعة البحث العلمي، محققة قفزة من الحوسبة المتسارعة إلى العلوم المتسارعة. وتقع شركة NVIDIA في قلب هذه العاصفة من التغيير التكنولوجي، وينبغي لها أن تكون تطلعية بما يكفي للاستفادة من هذه الفرصة.

في الكلمة الرئيسية لمؤتمر GTC 2025 الذي انتهى للتو، أعلن هوانج رينكسون أن المطورين يمكنهم الآن استخدام CUDA-X وأحدث بنية للرقائق الفائقة لتحقيق تكامل وتنسيق تلقائي أكثر إحكامًا بين موارد وحدة المعالجة المركزية ووحدة معالجة الرسومات، مما يجعل أدوات الهندسة الحسابية الخاصة بهم أسرع بـ 11 مرة وأقوى حسابيًا بـ 5 مرات من استخدام بنى الحوسبة المتسارعة التقليدية.

واختتم هوانغ قائلا:تعمل CUDA-X بالفعل على جلب الحوسبة السريعة إلى مجموعة من التخصصات الهندسية الجديدة، بما في ذلك علم الفلك، وفيزياء الجسيمات، والفيزياء الكمومية، وتصميم السيارات، والفضاء الجوي، وتصميم أشباه الموصلات.

في مؤتمر GTC لعام 2018،كشفت شركة NVIDIA عن أول منصة ذكاء اصطناعي لها، NVIDIA Clara، للصناعة الطبية.ركزت الشركة في البداية على مجال التصوير الطبي، حيث تقدم حلول الذكاء الاصطناعي القائمة على وحدة معالجة الرسوميات لتسريع معالجة بيانات الصور الطبية. في عام 2019، قامت NVIDIA Clara بالتوسع بشكل أكبر لتشمل منصة الحوسبة الجينومية الجديدة Clara Genomics، والتي تستخدم لتحليل تسلسل DNA/RNA ومعالجة البيانات الجينية السريعة.

في نهاية عام 2019، استحوذت شركة NVIDIA على شركة Parabricks، وهي شركة متخصصة في تطوير برامج تسلسل الجينات، وقامت بدمج أدوات تسلسل الجينات المعجلة بواسطة وحدة معالجة الرسوميات في منصة NVIDIA Clara. وفقًا للوثائق الرسمية لشركة NVIDIA،يمكن لـ Parabricks تحليل 30 ضعف الجينوم البشري بأكمله في 10 دقائق.وتستغرق الطرق الأخرى 30 ساعة.

في مؤتمر GTC لعام 2021،أطلقت شركة NVIDIA منصة Clara Holoscan، وهي منصة الحوسبة بالذكاء الاصطناعي في الوقت الفعلي المخصصة للأجهزة الطبية.الهدف هو تمكين المعدات الطبية من الحصول على قدرات الحوسبة بالذكاء الاصطناعي في الوقت الفعلي، وبالتالي تحسين مستوى الذكاء في تحليل الصور الطبية والمساعدة الجراحية والطب عن بعد.

في مؤتمر GTC الذي عقد في سبتمبر 2022، قامت NVIDIA بتوسيع Clara بشكل أكبر وإطلاق BioNeMo. في ذلك الوقت، أصبحت خطة NVIDIA للذكاء الاصطناعي في مجال العلوم واضحة بشكل متزايد، من الحوسبة المتسارعة بالذكاء الاصطناعي إلى الذكاء الاصطناعي التوليدي، ومن منصة الذكاء الاصطناعي الأولية للتصوير الطبي إلى أبحاث علوم الحياة الأكثر تعمقًا. خاصة،BioNeMo هو إطار عمل لتدريب ونشر نماذج اللغة الجزيئية الحيوية الكبيرة على نطاق حسابي كبير للغاية.يحتوي على 4 نماذج لغوية مدربة مسبقًا:

* بروتين LLM ESM-1: يقوم بمعالجة تسلسلات الأحماض الأمينية ويولد تمثيلات يمكن استخدامها للتنبؤ بخصائص ووظائف البروتين المختلفة، مما يحسن قدرة العلماء على فهم بنية البروتين. 

* إصدار مفتوح المصدر لأداة نمذجة البروتين OpenFold.
* نموذج الكيمياء التوليدية MegaMolBART: يمكن استخدامه للتنبؤ بالتفاعلات والتحسين الجزيئي وتوليد جزيئات جديدة. 

* ProtT5: تم تطويره بواسطة RostLab من جامعة ميونيخ التقنية بالتعاون مع NVIDIA، وهو يوسع وظائف بروتينات LLM الخاصة بـ Meta AI مثل ESM-1b لتوليد التسلسل.

بالإضافة إلى الأبحاث الطبية وعلوم الحياة،كما أطلقت NVIDIA أيضًا منصة السحابة الرقمية التوأم للمناخ Earth-2 في GTC 2024.باستخدام نموذج الذكاء الاصطناعي التوليدي CorrDiff الذي تم إطلاقه حديثًا، جنبًا إلى جنب مع NVIDIA FourCastNet، يمكن تحقيق محاكاة المناخ العالمي على مستوى كيلومتر واحد.

خاتمة

لقد تم ترقية كل مؤتمر GTC منذ فترة طويلة من مجرد "ترويج" للمنتجات والتقنيات الجديدة إلى معيار صناعي. في مؤتمر هذا العام، رأينا توقعات هوانغ رينكسون للجيل القادم من هندسة الرقائق والمنتجات، ورأينا أيضًا تخطيطه النشط في مجالات الروبوتات والقيادة الذاتية والحوسبة العلمية. من الواضح أنه من السابق لأوانه أن نأمل في أن يتحول الأخير بسرعة إلى مصدر الدم الرئيسي لشركة Nvidia، ولكن من الصعب أيضًا عكس معنويات السوق الحالية بسرعة وإزالة العقبات أمام الأول. دعونا جميعًا نتطلع إلى ما قد يبتكره هوانغ من "حيل جامحة" أخرى في المستقبل.