HyperAIHyperAI
Back to Headlines

R²D²: تحسين تدريب الروبوتات بفضل النماذج الأساسية للعالم وسير العمل من أبحاث NVIDIA

منذ 5 أيام

تقدم NVIDIA منصة NVIDIA Cosmos كحل متكامل لتطوير نماذج الأساس العالمية (World Foundation Models - WFMs)، التي تُعدّ حجر الزاوية في تطوير الذكاء الاصطناعي البدني، مثل الروبوتات والمركبات ذاتية القيادة. تُواجه هذه الأنظمة تحديًا كبيرًا في الحصول على بيانات واقعية مُصنّفة بدقة، ما يدفع إلى الاعتماد على البيانات الاصطناعية عالية الجودة. وتُسهم WFMs في تسريع هذه العملية من خلال التوليد التلقائي والتحليل الذكي للبيئات. تُصنف نماذج Cosmos إلى ثلاث فئات رئيسية: Cosmos Predict، Cosmos Transfer، وCosmos Reason. تُستخدم هذه النماذج معًا في سير عمل متكامل لتصنيع بيانات اصطناعية متنوعة وواقعية، وتحسين التحويل من المحاكاة إلى العالم الحقيقي (sim-to-real). Cosmos Predict تُولّد مشاهد مستقبلية متماسكة في شكل مقاطع فيديو من مدخلات نصية أو صور أو مقاطع فيديو. تم تدريبها على فهم الديناميكيات الفيزيائية، مما يضمن دقة التوقعات. تم تطبيقها بنجاح في مشاريع مثل Single2MultiView، التي تحوّل مقطعًا من كاميرا أمامية إلى عدة زوايا متماسكة، مُعززةً تطوير أنظمة القيادة الذاتية. كما تم استخدامها في تدريب روبوتات على مهام معقدة مثل سقي النباتات، حيث أظهرت النماذج قدرة عالية على التنبؤ بالمسارات الحركية. فيما يُستخدم Cosmos Transfer لخلق بيانات اصطناعية مُتحكم بها، حيث يسمح للمستخدمين بتحديد مدخلات متعددة مثل الخرائط عالية الدقة، الخرائط العميقة، أو خرائط الحواف، مع دمج أوامر نصية لتعديل الظروف (مثل "يوم ممطر" أو "ليلة مظلمة"). يُنتج هذا النموذج مشاهد متنوعة وشاملة لحالات حادة، مما يعزز قدرة الروبوتات والمركبات على التكيف مع بيئات غير متوقعة. أما Cosmos Reason، فهو نموذج ذكي يعتمد على التفكير الطويل (long-horizon reasoning)، ويُستخدم كمُقيّم للبيانات أثناء عملية التوليد. يُدرّب على مراحل: التدريب المُوجّه (SFT) باستخدام مجموعات بيانات مثل RoboVQA، ثم التعلم بالتعزيز (RL)، مما يُمكّنه من فهم السياقات الفيزيائية والقرارات المنطقية في المهام البدنية. يمكنه تقييم سلسلة من الإجراءات، وتحسين جودة البيانات التدريبية، مما يُقلل الأخطاء في التدريب. تم تطوير أدوات مكملة مثل DiffusionRenderer، التي تُعيد تضيئَة الصور والفيديوهات بذكاء، وIsaac GR00T-Dreams وCosmos-Drive-Dreams، التي تُعزز تدريب الروبوتات على مهام واقعية من خلال محاكاة ذكية. تُعدّ هذه المبادرات جزءًا من سلسلة NVIDIA Robotics Research and Development Digest (R2D2)، التي تُقدّم رؤى عميقة حول أحدث التطورات في الذكاء الاصطناعي البدني. يمكن للباحثين والمهندسين الوصول إلى المشاريع عبر مواقع GitHub، Hugging Face، وورقات بحثية. كما تدعو NVIDIA إلى المشاركة في فعاليات SIGGRAPH 2025، حيث سيتم عرض أحدث إنجازات هذه التقنيات. لمن يرغب في بدء رحلته في الروبوتات، تُقدّم NVIDIA دورات مجانية في "أساسيات الروبوتات"، مع إمكانية الاشتراك في النشرة البريدية ومتابعة المحتوى على YouTube وDiscord.

Related Links

R²D²: تحسين تدريب الروبوتات بفضل النماذج الأساسية للعالم وسير العمل من أبحاث NVIDIA | العناوين الرئيسية | HyperAI