شركات مثل CrowdStrike وUber وZoom تُسرّع تطوير الوكلاء الذكية باستخدام نماذج NVIDIA Nemotron وCosmos للذكاء الاصطناعي في المؤسسات والتطبيقات الفيزيائية تشهد صناعة الذكاء الاصطناعي قفزة نوعية مع دخول نماذج تفكير متقدمة من NVIDIA، مثل Nemotron وCosmos، في مراكز الابتكار لشركات عالمية، بهدف بناء وكلاء ذكية قادرة على أداء مهام معقدة واتخاذ قرارات مستقلة في بيئات عمل حقيقية. وفقًا لتقرير من Capgemini، قد يُسهم الذكاء الاصطناعي الوكيلية في تحقيق عائدات تصل إلى 450 مليار دولار من وفورات تكلفة وزيادة الإيرادات بحلول 2028. في مؤتمر SIGGRAPH، كشفت NVIDIA عن توسعة كبيرة في عائلتي نماذجها المُخصصة للتفكير: Nemotron وCosmos، التي تُعدّ حجر الأساس في تطوير أنظمة ذكاء اصطناعي قادرة على التفكير العميق، واتخاذ قرارات دقيقة، والتفاعل مع العالم المادي عبر الروبوتات والأنظمة الذكية. من بين الشركات الرائدة التي تستخدم هذه النماذج: CrowdStrike، التي تختبر نموذج Nemotron لتمكين وكيلها الذكي Charlotte من صياغة استعلامات معقدة على منصة Falcon، وUber التي تستكشف استخدام Cosmos Reason لتحليل سلوك المركبات ذاتية القيادة وتحسين جودة البيانات البصرية. كما تستخدم Zoom نماذج Nemotron لتعزيز قدرات Zoom AI Companion على تنفيذ مهام متعددة الخطوات داخل الاجتماعات والدردشات والمستندات. فيما يُعد Nemotron Nano 2 وLlama Nemotron Super 1.5 أحدث إصدارات العائلة، حيث يُقدمان أعلى دقة في فئات حجمها، خاصة في المهام التي تتطلب تفكيرًا علميًا، حسابات رياضية، برمجة، استخدام الأدوات، اتباع التعليمات، والدردشة. ويتميزان ببنية مختلطة، ونماذج مضغوطة، وموازنة قابلة للتخصيص لاستهلاك الرموز (tokens)، مما يقلل التكاليف بنسبة 60% مع تحسين الأداء. ومن أبرز الميزات: Llama Nemotron Super 1.5 متاح الآن بتنسيق NVFP4، ما يضاعف الإنتاجية بنسبة 6 أضعاف على بطاقات NVIDIA B200 مقارنةً بـ H100، مع الحفاظ على أعلى دقة في التفكير ضمن نفس الميزانية الحاسوبية. كما أطلقت NVIDIA أول مجموعة بيانات مفتوحة لنموذج رؤية لغة (VLM) – Llama Nemotron VLM Dataset v1 – بـ 3 ملايين عينة من البيانات البصرية والتنصية والأسئلة، لدعم تدريب النماذج وتحسين دقتها. بالإضافة إلى ذلك، يُعزز نموذج Llama 3.2 NeMo Retriever – الذي يتصدر ثلاث مسابقات رائدة في استرجاع المستندات البصرية – دقة الأنظمة الوكيلية من خلال تزويد الوكلاء بمعلومات حديثة وذات صلة من مصادر متعددة. وتم تطوير عميل بحث عميق باستخدام "النظام البيئي AI-Q من NVIDIA"، والذي يُعدّ الآن الأفضل في فئة الوكلاء المفتوحة والقابلة للتنقل على منصة DeepResearch Bench. أما نموذج Cosmos Reason، فهو خطوة ثورية في الذكاء الاصطناعي الفيزيائي. مصمم خصيصًا لفهم العالم الحقيقي من خلال التفكير المنظّم، يمتلك القدرة على فهم مبادئ الفيزياء، وثبات الأجسام، وتمايز الفضاء والزمن – ما يمكّن الروبوتات من التفاعل مع بيئات غير مألوفة باستخدام المنطق والخبرة السابقة. يُستخدم Cosmos Reason كنواة تفكير في نماذج رؤية-لغة-عمل (VLA)، ويدعم تدريب نماذج الروبوتات، وتحليل مقاطع الفيديو، وتحسين دقة أنظمة المراقبة في المصانع، والمستودعات، والمطارات، وتقاطعات الطرق. شركات مثل Centific وVAST وAmbient.ai تُطوّر منصات ذكية للسلامة والرصد في البيئات الصناعية والحضرية، باستخدام Cosmos Reason لتحليل الفيديو في الوقت الفعلي، وكشف الحوادث، وتحديد معدات الحماية المفقودة، وتحسين اتخاذ القرار. وستُتاح هذه النماذج قريبًا كخدمات NIM من NVIDIA، مع دعم متكامل عبر منصات سحابية عالمية مثل Amazon Bedrock وAzure AI Foundry وOracle وGoogle Vertex AI، مما يضمن أمانًا وتحكمًا عاليين في البيئات المؤسسية. يمكن تجربة Cosmos Reason على build.nvidia.com أو تنزيله من Hugging Face وGitHub. وستُتاح نماذج Nemotron Nano 2 وLlama Nemotron Super 1.5 (NVFP4) قريبًا للتحميل، مع إتاحة النسخ السابقة والبيانات التدريبية المفتوحة.
في مؤتمر SIGGRAPH، كشفت NVIDIA عن توسعة كبيرة في نموذجيها المُوجَّهين للتفكير الاصطناعي، Nemotron وCosmos، اللذين أصبحا محورًا لتطوير وكالة ذكية في المؤسسات والأنظمة الفيزيائية. وبحسب تقرير Capgemini، يمكن أن يُسهم تطوير الوكالات الذكية في تحقيق عائدات وتخفيضات تصل إلى 450 مليار دولار بحلول 2028، مما يعزز اهتمام الشركات الكبرى بالاستثمار في نماذج التفكير المتقدمة. من بين الشركات الرائدة التي تستخدم هذه النماذج: CrowdStrike، Uber، Zoom، Magna، NetApp، وEY. وتُعد نماذج Nemotron Nano 2 وLlama Nemotron Super 1.5 الأعلى دقة في فئاتها من حيث التفكير العلمي، والرياضيات، والبرمجة، واستدعاء الأدوات، واتباع التعليمات، والدردشة. وتتميز هذه النماذج ببنية هجينة جديدة، ونماذج مُكثفة (quantized)، ونظام "ميزانية تفكير قابلة للتكوين"، مما يقلل تكاليف التفكير بنسبة 60% ويُسرّع الأداء دون زيادة استهلاك الطاقة أو الوقت. وتفوق Nemotron Nano 2 النماذج المماثلة في كفاءة إنتاج الرموز بنسبة تصل إلى 6 أضعاف، بينما تُقدّم Llama Nemotron Super 1.5 أعلى دقة في فئتها، مع دعمها لـ NVFP4، ما يُضاعف الأداء على وحدات B200 مقارنةً بـ H100. كما أطلقت NVIDIA أول مجموعة بيانات مفتوحة لنموذج الرؤية واللغة (VLM) تُسمى Llama Nemotron VLM Dataset v1، تحتوي على 3 ملايين عينة من بيانات التعرف البصري، والأسئلة المرئية، والوصف، لدعم النماذج السابقة. كما أن نموذج Llama 3.2 NeMo Retriever يتصدر ثلاث جداول تصنيف لاسترجاع الوثائق المرئية، مما يعزز دقة أنظمة الوكالات الذكية. بالإضافة إلى ذلك، تدعم منصات NVIDIA NeMo وNIM دورة حياة الوكالة الذكية بالكامل، من التطوير إلى النشر والرصد والتحسين. أما Cosmos Reason، فهو نموذج VLM مُخصص للذكاء الاصطناعي الفيزيائي، بحجم 7 مليار معلمة، يُمكّن الروبوتات من فهم العالم الحقيقي باستخدام منطق منظم، مثل الفيزياء، وثبات الأجسام، والتمايز الزماني-المكاني. ويُستخدم كـ "دماغ" لنموذج VLA (رؤية-لغة-فعل)، أو كمحرّر بيانات تدريب للروبوتات والمركبات ذاتية القيادة، أو كمحرّك تحليل فيديو لاستخراج رؤى من كميات ضخمة من البيانات المرئية. استخدمت Uber نموذج Cosmos Reason لتحليل سلوك المركبات ذاتية القيادة، وتحليل سيناريوهات مثل عبور المشاة للطرق السريعة. وتطوّر Magna منصة توصيل ذكية باستخدام النموذج لتحسين التخطيط طويل الأمد في مدن جديدة. أما Centific وVAST وAmbient.ai، فاستخدمتهما لتحسين السلامة في المنشآت الصناعية، وتحليل الفيديو في الوقت الفعلي، والكشف التلقائي عن معدات الحماية أو المخاطر. تُخطط NVIDIA لتقديم هذه النماذج كخدمات NIM على أي بنية مدعومة بـ NVIDIA، مع توفرها قريباً عبر منصات AWS (Bedrock وSageMaker)، وAzure، وOracle، وGoogle Vertex AI. يمكن تجربة Cosmos Reason على build.nvidia.com، أو تنزيله من Hugging Face وGitHub. وستُتاح Nemotron Nano 2 وLlama Nemotron Super 1.5 (NVFP4) قريباً للتنزيل، بينما يمكن الاطلاع على الإصدارات السابقة وتحميل مجموعة البيانات من منصات NVIDIA.