HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 25 أيام

OmniRetarget: توليد بيانات محفوظة التفاعل لحركة الإنسان الآلي بأكمل جسمه ومهام التلاعب والتفاعل مع المشهد

Lujie Yang Xiaoyu Huang Zhen Wu Angjoo Kanazawa Pieter Abbeel Carmelo Sferrazza et al

OmniRetarget: توليد بيانات محفوظة التفاعل لحركة الإنسان الآلي بأكمل جسمه ومهام التلاعب والتفاعل مع المشهد

الملخص

النمط السائد في تعليم الروبوتات البشرية المهارات المعقدة هو إعادة توجيه الحركات البشرية كمرجعيات حركية لتدريب سياسات التعلم المعزز (RL). ومع ذلك، غالبًا ما تواجه خطوط إنتاج إعادة التوجيه الحالية صعوبات كبيرة ناتجة عن الفجوة الهيكلية الكبيرة بين البشر والروبوتات، مما يؤدي إلى ظهور أخطاء فيزيائية غير ممكنة من الناحية الميكانيكية، مثل انزلاق الأقدام أو التداخل بين الأجسام. والأهم من ذلك، فإن الطرق الشائعة لإعادة التوجيه تتجاهل التفاعلات الغنية بين الإنسان والجسم وبين الإنسان والبيئة، والتي تُعد ضرورية لتحقيق حركات متنقلة تعبيرية ومهارات متنقلة-مُعَلَّمة (loco-manipulation). لمعالجة هذه المشكلة، نقدّم "أومني ريتارجيت" (OmniRetarget)، وهو محرك لتكوين البيانات يحافظ على التفاعلات، مبني على شبكة تفاعلية (interaction mesh) تُعدّ نموذجًا صريحًا للعلاقات المكانية والاتصالات الحيوية بين الوكيل (الإنسان أو الروبوت)، والسطح، والأجسام التي يتم التلاعب بها. من خلال تقليل التشوه اللابلاسي (Laplacian deformation) بين الشبكات البشرية والروبوتية مع فرض قيود حركية، يتم إنتاج مسارات ممكنة من الناحية الحركية. علاوة على ذلك، فإن الحفاظ على التفاعلات ذات الصلة بالمهام يُمكّن من تكبير البيانات بكفاءة، من مثال توضيحي واحد إلى أشكال مختلفة من الروبوتات، وأسطح مختلفة، وتوزيعات مختلفة للأجسام. قمنا بتقييم أومني ريتارجيت بشكل شمولي من خلال إعادة توجيه حركات من مجموعات بيانات OMOMO، LAFAN1، وبيانات الحركة المأخوذة من مختبرنا (MoCap)، ما أنتج أكثر من 8 ساعات من المسارات، والتي حققت أداءً أفضل من الخطوط الأساسية المستخدمة على نطاق واسع من حيث الالتزام بالقيود الحركية والحفاظ على التلامس. وتمكّن هذه البيانات عالية الجودة سياسات التعلم المعزز القائمة على الإدراك الذاتي (proprioceptive RL) من تنفيذ مهارات قفز متعددة (parkour) ومهارات متنقلة-مُعَلَّمة لفترة طويلة (تصل إلى 30 ثانية) على روبوت بشري من نوع Unitree G1، تم تدريبه باستخدام فقط 5 معايير مكافأة وتجريب عشوائي للبيئة بسيط مشترك بين جميع المهام، دون الحاجة إلى أي خطة تدريبية متدرجة.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
OmniRetarget: توليد بيانات محفوظة التفاعل لحركة الإنسان الآلي بأكمل جسمه ومهام التلاعب والتفاعل مع المشهد | الأوراق البحثية | HyperAI