نVIDIA تطلق GR00T N1.6 لبناء روبوتات بشرية عامة بقدرات ذكية متعددة عبر تدريب افتراضي ونقل فعّال إلى العالم الحقيقي
أطلقت نيفيديا نسخة جديدة من نموذج الروبوت العام المُتعدد المهام، GR00T N1.6، ضمن إطار عمل يُعرف بـ "المحاكاة إلى الواقع" (Sim-to-Real)، بهدف تمكين الروبوتات البشرية الشكل من أداء مهام معقدة في بيئات ديناميكية. يُعدّ هذا النموذج خطوة متقدمة في تطوير الروبوتات القادرة على التفكير، الحركة، والتفاعل مع البيئة بذكاء، من خلال دمج مهارات الرؤية، التفاعل باللغة، واتخاذ القرار. يُبنى GR00T N1.6 على نموذج متعدد الوسائط (Vision-Language-Action) يدمج مدخلات بصرية من كاميرات مثبتة على الروبوت، وحالة الروبوت، والتعليمات النصية الطبيعية، لتكوين سياسة تصرف موحدة. يعتمد النموذج على نموذج "Cosmos Reason" لتحليل التعليمات العليا وتحويلها إلى خطوات عملية مبنية على فهم السياق، مما يمكّنه من تنفيذ مهام تشمل التنقل والManipulation الدقيقة بشكل متكامل. أبرز التحسينات في النسخة N1.6 تشمل دعم دقة عالية في الرؤية دون تشويه، مما يعزز فهم البيئة ودقة التخطيط. كما تم تضخيم نموذج التحويل التدفقي (diffusion transformer) بنسبة 2x، مع تحسين التنبؤات الحركية بناءً على الحالة الحالية، ما يُنتج حركات أكثر سلاسة وانسيابية. كما تم تدريب النموذج على ملايين الساعات من بيانات التحكم البشري المتنوعة (بما في ذلك روبوتات بشرية الشكل، وروبوتات متحركة مزودة بذراعين)، مما يُحسّن قدرته على التعميم بين أنواع مختلفة من الروبوتات، مع دعم للتشغيل الصفرية (zero-shot) على أشكال جديدة. في إطار العمل، يتم تدريب سياسات التحكم الدقيقة باستخدام التعلم بالتعزيز (Reinforcement Learning) في بيئة المحاكاة NVIDIA Isaac Lab، مما يُنتج حركات بشرية شبه طبيعية، مستقرة ديناميكيًا، تشمل المشي، التلاعب، والتفاعل متعدد النقاط مع البيئة. تُنقل هذه السياسات مباشرة إلى الروبوتات الحقيقية دون الحاجة إلى تدريب مخصص، مما يقلل من التكاليف ويزيد من المرونة. لإضافة القدرة على التنقل الهدف-إلى-هدف، تم تدريب نموذج GR00T على بيانات اصطناعية ضخمة باستخدام أداة COMPASS، التي تُولّد مسارات متنوعة عبر بيئات مختلفة. يُستخدم هذا النموذج كـ "خبير تنقل" يُوجّه الروبوت عبر مسارات آمنة، مع تجنب العوائق، وتنفيذ انتقالات بين التنقل والتمكين، مع الاعتماد على سياسة التحكم الدقيقة لضبط التوازن والاتصال بالبيئة. إضافة إلى ذلك، يعتمد النظام على تقنية استشعار الموضع البصري المدعومة بتقنيات NVIDIA CUDA، حيث يتم بناء خرائط مسبقة باستخدام كاميرات ستيريو، تشمل خرائط المواقع المميزة (cuVSLAM)، وخرائط الكلمات المفتاحية (cuVGL)، وخرائط الازدحام (occupancy map). عند التشغيل، تُستخدم هذه الخرائط لتحديد موقع الروبوت بدقة، مما يسمح بتوجيه الأوامر بدقة في الفضاء الحقيقي. تم تطوير أدوات تفاعلية تتيح للمطورين إعادة إنتاج هذه الأنظمة عبر بيئة ROS2، مع دعم لعملية إنشاء الخرائط وتحديد المواقع تلقائيًا. يُمكن للمهندسين والباحثين الاستفادة من هذه الأدوات لبناء أنظمة روبوتية قادرة على العمل في بيئات واقعية معقدة. يُعدّ GR00T N1.6 نموذجًا متكاملًا يُمكّن الروبوتات من أداء مهام عامة بذكاء، من خلال دمج التعلم في المحاكاة، والتنقل المدعوم بالذكاء الاصطناعي، وتحديد المواقع الدقيق، ممّا يُمهد الطريق لروبوتات بشرية الشكل قادرة على العمل في المنازل، المصانع، والبيئات العامة.
