إطلاق نماذج ذكاء اصطناعي متخصصة مع Nemotron Vision وRAG ونماذج حماية
في مؤتمر GTC DC أعلنت نيفيديا عن تطورات كبيرة في مجال الذكاء الاصطناعي العامل أو Agentic AI من خلال إطلاق سلسلة جديدة من النماذج المفتوحة المسمّاة Nemotron التي تُمكّن المطورين من بناء أنظمة ذكاء اصطناعي متعددة الوسائط قادرة على التخطيط والتفكير واسترجاع المعلومات وضمان السلامة. تُعد هذه النماذج جزءًا من نظام بيئي متكامل يعتمد على نماذج لغوية وبصرية متخصصة تعمل معًا لدعم تطبيقات واقعية في مجالات مثل تحليل الوثائق والفيديو والبحث المدعوم باسترجاع المعلومات وحماية المحتوى. لبناء أنظمة ذكاء اصطناعي متخصصة، تُعد النماذج المفتوحة القابلة للتعديل، والبيانات عالية الجودة، ووصفات الأداء المثالي، والتشغيل الفعّال في المقياس ضرورية. أبرز النماذج التي تم الكشف عنها هو Nemotron Nano 3 وهو نموذج متعدد التخصصات بحجم 32 مليار معلمة مع 3.6 مليار معلمة نشطة يعتمد على بنية MoE، ويتميز بأداء عالٍ في السرعة والدقة مقارنة بالنماذج الكثيفة المماثلة. يُستخدم في المهام المعقدة مثل التفكير العلمي والبرمجة والرياضيات واستدعاء الأدوات، مع تقليل تكاليف الحوسبة والتأخير. كما تم إطلاق Nemotron Nano 2 VL نموذج متعدد الوسائط بحجم 12 مليار معلمة مُدرّب على أكثر من 11 مليون عينة عالية الجودة، ويُعتبر من أفضل النماذج في معايير مثل OCRBenchV2. يعتمد على بنية هجينة مزيج من Mamba وTransformer، ويستخدم تقنية التقطيع الفعّال للفيديو EVS التي تقلل من التكرار البصري دون فقدان المعنى، مما يُحسّن الأداء في معالجة مقاطع الفيديو الطويلة بنسبة تصل إلى 2.5 مرة. تم تحسين Nemotron Parse 1.1 وهو نموذج صغير بحجم 1 مليار معلمة مخصص لتحليل الوثائق، ويُظهر أداءً متميزًا في استخراج الجداول والنصوص والهيكلية من الصور، مما يعزز دقة أنظمة الاسترجاع وتدريب النماذج. كما تم إطلاق Nemotron RAG سلسلة من النماذج المخصصة لبناء أنظمة استرجاع مدعومة بالذكاء الاصطناعي، مع دعم خاص للبيانات الداخلية وحماية الخصوصية، وتُستخدم في تطبيقات مثل المساعدات الذكية والأنظمة التعاونية في الشركات. من أجل ضمان السلامة، تم إطلاق Llama 3.1 Nemotron Safety Guard 8B V3 نموذج متعدد اللغات مُدرّب على مجموعة بيانات ثقافية متنوعة تضم أكثر من 386 ألف عينة، ويُمكنه كشف المحتوى غير الآمن في تسع لغات بما في ذلك العربية والهندية واليابانية، مع دقة تصنيف تصل إلى 84.2% وتأخير منخفض. يعتمد النموذج على تقنيات مبتكرة مثل التكيّف الثقافي وتصفية التناقضات. لضمان تقييم دقيق للنماذج، أطلقت نيفيديا SDK NeMo Evaluator وNeMo Agent Toolkit المفتوح المصدر، اللذان يُمكّنان المطورين من تقييم الأداء في مهام تفاعلية وتحسين الوكلاء تلقائيًا. يمكن تنزيل النماذج من Hugging Face أو استخدامها عبر مزودي خدمة مثل Baseten وReplicate، مع دعم لمحركات التفسير vLLM وTRT-LLM. يمكن الوصول إلى النماذج عبر منصات مثل build.nvidia.com وOpenRouter. تُعد هذه الخطوات خطوة كبيرة نحو بناء أنظمة ذكاء اصطناعي مفتوحة وآمنة وفعّالة تُناسب البيئات الصناعية.
