نفيديا هي الشركة الوحيدة في صناعة النماذج الذكية التي يمكنها التضحية بها مجانًا
Nvidia يُعدّ الشركة الوحيدة التي تستطيع تقديم نماذج الذكاء الاصطناعي مجانًا، وذلك بفضل قدرتها الفريدة على تأمين مراكز حوسبة ضخمة بتكاليف منخفضة، مدفوعة بربحية هائلة من أعمالها في مجال الهاردوير. بينما تتجه شركات مثل OpenAI وAnthropic وGoogle نحو نماذج مغلقة، وتسعى ميتا إلى التحول نحو نموذج مغلق باسم Avocado، تستمر Nvidia في تعزيز مبادراتها المفتوحة المصدر عبر سلسلة نماذج Nemotron، بدءًا من Nemotron 3 الذي تم الكشف عنه حديثًا. السبب وراء هذه الاستراتيجية هو أن Nvidia تستطيع بناء مراكز تدريب ذكاء اصطناعي بأي حجم بتكاليف معقولة، وتدفع مقابل استخدامها بأسعار تنافسية جدًا — 4500 دولار لكل وحدة معالجة رسومية سنويًا، مقابل تكلفة وحدة معالجة تصل إلى 45 ألف دولار. هذا النموذج يشبه طريقة بيع أنظمة IBM System/360 في الستينيات، حيث كانت الشركة تقدم الدعم البرمجي المجاني مع الجهاز، ثم حولت هذه الخدمة إلى مصدر ربح عبر خدمات الدعم والصيانة. Nvidia ليست جديدة في مجال النماذج المفتوحة المصدر، فقد بدأت بتطوير نموذج Megatron-LM عام 2019، ثم توسع إلى 530 مليار معامل عبر التعاون مع مايكروسوفت. ومن ثم طرحت منصة NeMo لتوفير أدوات لبناء النماذج، والتي أصبحت أساسًا لسلسلة Nemotron. نماذج Nemotron 1 كانت مبنية على نموذج Llama 3.1 مع تقنيات تفكير متطورة، بينما Nemotron 2 Nano دمج بين بنية الترانسفورمر (المبتكرة من جوجل) وتقنية Mamba التي تُحسّن الكفاءة في معالجة البيانات الطويلة. أما Nemotron 3، فهو نموذج هجين يجمع بين الترانسفورمر وMamba، ويستخدم معمارية "مزيج الخبراء" (MoE) لتحسين الكفاءة. يُقلل هذا الهجين من استهلاك الذاكرة عبر تجنب إنشاء خرائط انتباه ضخمة، مما يسمح بتوسيع عدد الخبراء داخل النموذج. في النسخة الفائقة (Ultra)، تم تقديم تقنية "مزيج الخبراء المخفي" (latent MoE)، حيث يشارك الخبراء نواة مشتركة ويحتفظ كل منهم بجزء صغير خاص به، مما يعزز الكفاءة بنسبة تصل إلى 4 أضعاف في عدد الخبراء دون التضحية بالأداء. النسخ الحالية من Nemotron 3 تشمل Nano (30 مليار معامل، 3 مليار نشطة)، Super (100 مليار معامل، 10 مليار نشطة)، وUltra (500 مليار معامل، 50 مليار نشطة). النموذج يعتمد على تدريب مكثف باستخدام بيانات بدقة 4 بت (NVFP4) على مجموعة تدريب بحجم 25 تريليون توكين، مع نافذة سياق تصل إلى مليون توكين. كما يُستخدم التعلم المُعزَّز بشكل واسع، مقارنة بـ Nemotron 2 الذي اعتمد على التعلم المراقب. النتائج الأولية تُظهر تحسنًا كبيرًا في الأداء: Nemotron 3 Nano يُحقّق سرعة تفوق نماذج Nemotron 2 بمرات عديدة، مع توازن مثالي بين الدقة والسرعة. في معايير مثل Artificial Analysis، يظهر النموذج في موضع متميز على المخططات التي تُقيّم الدقة مقابل سرعة التوليد. بما أن Nvidia تمتلك البنية التحتية والخبرة، من الممكن أن تقدم دعمًا فنيًا لـ Nemotron كجزء من بستك AI Enterprise، بأسعار تغطي التكاليف فقط، مما يُضعها في موضع تنافسي قوي أمام النماذج المغلقة. في النهاية، قد تتحول Nvidia من مزود هاردوير إلى "مورد ذكاء اصطناعي" حقيقي — ما يُعدّ تحوّلًا جذريًا في صناعة التكنولوجيا.
