VIRAL: رؤية من المحاكاة إلى الواقع على نطاق واسع للحركة والتحكم البشري في الروبوتات البشرية

الملخص
يعتبر النقص في مهارات التحرك والتحكم الذاتي (اللوكو-مانيبيلاشن) أحد الحواجز الأساسية أمام التنفيذ العملي للروبوتات البشرية الشكل في العالم الحقيقي. نقدم إطار عمل VIRAL، وهو إطار تعلم من المحاكاة إلى الواقع (sim-to-real) قائم على الرؤية، والذي يتعلم التفاعل بين الحركة والتحكم للروبوتات البشرية الشكل بالكامل داخل البيئة المحاكاة، ثم يُطبّق هذه المهارة مباشرة على الأجهزة الحقيقية دون الحاجة إلى أي تدريب إضافي (zero-shot). يتبع VIRAL تصميمًا يشبه التدريس من المعلم إلى الطالب: حيث يتعلم "معلم التعلم المعزز" (RL) المُزوّد بمعلومات كاملة عن الحالة، مهام التحرك والتحكم على مدى طويل باستخدام فضاء إجراءات تختلف عن الحالة الأساسية (delta action space) وبدءًا من حالة مرجعية، ثم يتم استخلاص سياسة "طالب" قائمة على الرؤية من هذا المعلم عبر محاكاة على نطاق واسع باستخدام تقنية الرسم المُقسّم (tiled rendering)، وتُدرّس هذه السياسة باستخدام مزيج من تقنيتي DAgger المباشرة والتقليد السلوكية (behavior cloning). ووجدنا أن الحجم الحسابي (compute scale) له أهمية حاسمة: إذ إن توسيع نطاق المحاكاة ليشمل عشرات وحدات المعالجة الرسومية (GPU) (حتى 64 وحدة) يجعل تدريب كل من المعلم والطالب موثوقًا، بينما تفشل غالبًا النظم ذات الحجم الحسابي المنخفض. ولسد الفجوة بين المحاكاة والواقع، يدمج VIRAL تطبيقًا واسع النطاق لعشوائية النطاق البصري (visual domain randomization) في عناصر متعددة، مثل الإضاءة، والمواد، وبارامترات الكاميرات، ونوعية الصور، وتأخيرات المستشعرات، مع محاذاة فعّالة بين الواقع والمحاكاة من حيث الأيدي الدقيقة وكاميرات الرؤية. عند تطبيقه على روبوت بشري الشكل من نوع Unitree G1، تُظهر السياسة القائمة على الصور الملونة (RGB) أداءً متواصلًا في التحرك والتحكم لمدة تصل إلى 54 دورة، مع قدرة على التعميم على تغيرات مكانيّة ومرئيّة متنوعة دون الحاجة إلى أي تعديل في البيئة الواقعية، وتقريبًا تصل إلى مستوى الأداء المُحرّك من قبل خبراء عبر التحكم عن بعد. وتشمل الدراسات الاستقصائية الواسعة (ablations) تحليلًا دقيقًا للخيارات التصميمية الأساسية التي تجعل تنفيذ التحرك والتحكم القائم على الصور الملونة (RGB) ممكنًا عمليًا في الروبوتات البشرية الشكل.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.