NVIDIA تطلق Cosmos Reason 2 لتعزيز القدرة التفكيرية للذكاء الاصطناعي في العالم المادي
أطلقت NVIDIA نسخة جديدة من نموذجها المُدرّب على التفكير البصري واللغوي، Cosmos Reason 2، الذي يُعدّ تقدّمًا كبيرًا في مجال الذكاء الاصطناعي البدني (Physical AI). يُعدّ النموذج الأفضل مفتوح المصدر في ميدان الفهم البصري، ويتصدّر لائحة "Physical AI Bench" و"Physical Reasoning" بتفوّق ملحوظ في الدقة. يُمكّن الروبوتات والوكالات الذكية من رؤية البيئة المحيطة، وفهمها، والتخطيط للإجراءات، والتفاعل معها بذكاء يشبه الطريقة التي يفكر بها الإنسان. يتميّز Cosmos Reason 2 بقدرات متقدمة في التفكير التسلسلي، واستخدام المعرفة العامة والفيزياء، وفهم الحركة عبر الزمن والمكان، ما يسمح له بالتعامل مع المواقف المعقدة، والتكيف مع الظروف الجديدة، وحل المشكلات خطوة بخطوة. يُعدّ نموذجًا متكاملًا يجمع بين الرؤية، اللغة، والتفكير، مما يجعله مناسبًا لتطبيقات حقيقية في العالم الواقعي. من أبرز الاستخدامات: - تحليل الفيديو وسياقه: يدعم النموذج الآن استخراج النص (OCR) وتحديد المواقع 2D/3D، وفهم العلامات المضمنة في الفيديو. مثال: تقييم حالة الطرق أثناء المطر من خلال تحليل محتوى فيديو. - التنقيب في الفيديو وملخصاته: تُقدّم NVIDIA نموذجًا جاهزًا (Blueprint) لتحليل الفيديو وفهرسته، مما يُسهّل على المطورين بناء وكالات ذكية لتحليل كميات هائلة من البيانات المرئية. - تحسين السلامة في أماكن العمل: شركات مثل Salesforce تستخدم النموذج مع روبوتات Cobalt ونظام Agentforce لتحليل لقطات فيديو وتحسين السلامة والامتثال. - تصنيف وتحرير البيانات: يُمكنه إنشاء وصفات دقيقة ومؤرخة (بتوقيت) لمقاطع فيديو حقيقية أو مُصوّرة افتراضيًا، ما يُسهم في تدريب نماذج ذكاء اصطناعي بجودة عالية. - السيارات ذاتية القيادة: استخدمت شركة Uber النموذج لتحسين وصف الفيديو المرتبط ببيانات التدريب، ما أدى إلى تحسّن ملحوظ في دقة التقييم: ارتفاع في معيار BLEU بنسبة 10.6%، وزيادة 0.67 نقطة في مهارات الإجابة على الأسئلة (VQA)، وتحسّن 13.8% في معيار LingoQA. - الروبوتات والاتخاذ المُخطط: يُقدّم Cosmos Reason 2 الآن إحداثيات مسار (Trajectory) للروبوتات، بجانب تحديد الخطوات التالية. مثال: توجيه مُمسك روبوتي لنقل شريط لاصق إلى سلة. - الدعم من شركات عالمية: شركات مثل Hitachi، Milestone، وVAST Data تستخدم النموذج لتطوير أنظمة روبوتية، وقيادة ذاتية، وتحليلات فيديو لتحسين السلامة المرورية وبيئة العمل. يمكن للمطورين تجربة Cosmos Reason 2 عبر منصة build.nvidia.com، وتحميل النماذج (2B و8B) من Hugging Face، أو استخدامها في السحابة عبر AWS، Google Cloud، وMicrosoft Azure. تتوفر وثائق مفصلة ودليل تطبيقات (Cosmos Cookbook) لتسهيل الاستخدام. يُعدّ Cosmos Reason 2 جزءًا من عائلة نماذج Cosmos، التي تشمل: - Cosmos Predict 2.5: يتنبأ بحالة العالم المادي مستقبلًا بناءً على صور أو نصوص أو فيديو. - Cosmos Transfer 2.5: نموذج خفيف لتحويل أسلوب الفيديو إلى عالم افتراضي. - NVIDIA GR00T N1.6: نموذج مُخصص للروبوتات البشرية، يدمج قدرات Cosmos Reason لتحسين التفكير والفهم السياقي. يُعدّ هذا التطور خطوة جوهرية نحو تمكين الذكاء الاصطناعي من التفاعل مع العالم المادي بذكاء حقيقي، وفتح آفاق جديدة في الروبوتات، النقل الذاتي، والتحليل الذكي للبيانات المرئية.
