NVIDIA تطلق نموذج Nemotron 3 Nano Omni لوكالات الذكاء الاصطناعي
أعلنت شركة إنفيديا رسميًا عن إطلاق نموذج "Nemotron 3 Nano Omni"، وهو نموذج مفتوح المصدر متعدد الوسائط يدمج قدرات الرؤية والصوت واللغة في نظام واحد. يهدف هذا الإصدار الجديد إلى معالجة الفجوات الحالية في أنظمة وكلاء الذكاء الاصطناعي التي تعتمد عادةً على نماذج منفصلة لكل مهمة، مما يؤدي إلى تأخر في الاستجابة وفقدان للسياق أثناء نقل البيانات بين النماذج. يضمن النموذج الجديد استجابة أسرع وأكثر ذكاءً من خلال تمكين الوكلاء من معالجة الفيديو والصورة والصوت والنص بكفاءة عالية. يُعد هذا الإصدار قفزة نوعية في مجال الكفاءة، حيث يتفوق على سواه في ست منصات تقييم رئيسية تتعلق بفهم المستندات المعقدة والفيديو والصوت. تم تصميم النموذج باستخدام هندسة هجينة متخصصة تعمل بـ 30 مليار معلمة مع 3 مليارات معلمة نشطة، مما يلغي الحاجة إلى نماذج استشعار منفصلة. هذا التكامل يسمح للأنظمة بتحقيق إنتاجية أعلى تصل إلى تسعة أضعاف مقارنة بالنماذج المفتوحة المماثلة الأخرى مع الحفاظ على دقة عالية في الإدراك متعدد الوسائط، مما يقلل التكاليف ويزيد من قابلية التوسع دون المساس بالجودة أو سرعة الاستجابة. بدأت شركات تقنية وبرمجيات رائدة مثل أبل، بالانتير، إكا كير، فوكسكون، وشركة إتش، في تبني النموذج فعليًا، بينما تجري شركات أخرى مثل ديل، دوكوساين، وأوراكل تقييمه. يؤكد غوتييه كلواك، الرئيس التنفيذي لشركة إتش، أن القدرة على تفسير شاشات عالية الدقة في الوقت الفعلي دون تأخير تمثل تحولًا جذريًا في كيفية تفاعل الوكلاء مع البيئات الرقمية، مشيرًا إلى أن هذا لا يعد مجرد تسريع بل تغييرًا في طريقة إدراك الأنظمة. يدعم النموذج تطبيقات متخصصة تشمل وكلاء الاستخدام الحاسوبي الذين يتنقلون في واجهات المستخدم graphical، وتحليل المستندات والرسوم البيانية والبيانات المختلطة، وفهم السياقات الصوتية والمرئية لخدمة العملاء والمراقبة. يتميز النموذج بكونه مفتوح الأوزان والبيانات، مما يمنح المؤسسات شفافية كاملة وسيطرة على كيفية تخصيصه ونشره، وهو ما يتناسب مع متطلبات السيادة البياناتية والامتثال التنظيمي. يمكن دمج هذا النموذج مع نماذج أخرى من عائلة إنفيديا أو نماذج مملوكة من مقدمي خدمات آخرين لإنشاء عملاء فرعيين لمهام معقدة. يتوفر النموذج الآن عبر منصات عامة مثل Hugging Face ومنصة NVIDIA NIM، ويدعم النشر على مجموعة واسعة من البيئات بدءًا من الأجهزة المحلية مثل وحدات NVIDIA DGX Spark وحتى مراكز البيانات السحابية. مع أكثر من 50 مليون تنزيل لعائلة نماذج Nemotron خلال العام الماضي، يمثل إصدار Omni امتدادًا لقدرة العائلة إلى المجالات متعددة الوسائط ووكلاء الذكاء الاصطناعي، مما يوفر للمطورين مسارًا واضحًا لبناء أنظمة ذكاء اصطناعي فعالة ودقيقة وقابلة للنشر عالميًا.
