HyperAIHyperAI
منذ يوم واحد

أوديسي: استكشاف وManipulation للحيوانات ذات الأربعة أرجل في عوالم مفتوحة للمهام ذات الأفق الطويل

Kaijun Wang, Liqin Lu, Mingyu Liu, Jianuo Jiang, Zeju Li, Bolin Zhang, Wancai Zheng, Xinyi Yu, Hao Chen, Chunhua Shen
أوديسي: استكشاف وManipulation للحيوانات ذات الأربعة أرجل في عوالم مفتوحة للمهام ذات الأفق الطويل
الملخص

تمثّل المُعالجة المُوجَّهة باللغة لمهام التلاعب الطويلة المدى في الروبوتات المتنقلة تحديًا كبيرًا في مجالات الاستدلال المعنوي المُدمج، والتلاعب القابل للتعميم، والحركة التكيّفية. وتشكل ثلاث قيود أساسية عائقًا أمام التقدم: أولاً، رغم أن النماذج اللغوية الكبيرة قد ساهمت في تحسين التفكير المكاني والتخطيط للمهام من خلال الافتراضات المعنوية، إلا أن التطبيقات الحالية ما زالت محدودة بسياقات الطاولات، ولا تُعالج قيود الرؤية ذاتية المركز (egocentric perception) ونطاقات التفعيل المحدودة التي تواجهها المنصات المتنقلة. ثانيًا، تُظهر استراتيجيات التلاعب الحالية قدرة تعميم غير كافية عند مواجهة التكوينات المتنوعة للأجسام في البيئات المفتوحة. ثالثًا، وعلى الرغم من أهميتها في التطبيقات العملية، لا تزال المطلوبات المزدوجة المتمثلة في الحفاظ على مرونة عالية في تحريك المنصة مع التحكم الدقيق في الطرف النهائي (end-effector) في البيئات غير المُنظمة موضوعًا مُستَهَملًا في الأبحاث.في هذا العمل، نقدّم "أوديسيا" (ODYSSEY)، وهي إطار موحد للتعامل المتنقل المُزود بذراع مُتَحَرِّك، مصمم خصيصًا للروبوتات ذات الأرجل الأربعة السريعة، والذي يدمج بشكل سلس بين التخطيط العالي المستوى للمهام والتحكم المنخفض المستوى في الجسم الكامل. ولحل تحدي الرؤية ذاتية المركز في المهام المُوجَّهة باللغة، نقدّم مُخططًا هرميًا يُستند إلى نموذج رؤية-لغة، يمكّن من تفكيك التعليمات الطويلة المدى وتنفيذ الإجراءات بدقة. على مستوى التحكم، نُقدّم سياسة جديدة للجسم الكامل تحقق تنسيقًا قويًا حتى في التضاريس الصعبة. كما نقدّم أول معيار تقييم للتعامل المتنقل الطويل المدى، يُقيّم سيناريوهات متنوعة داخلية وخارجية. وبفضل نجاح نقل النموذج من المحاكاة إلى الواقع، نُظهر قدرة النظام على التعميم والمتانة في التطبيقات الواقعية، مما يُبرز الجدوى العملية للروبوتات ذات الأرجل في البيئات غير المُنظمة. يُسهم هذا العمل في تعزيز إمكانية وجود مساعدات روبوتية عامة قادرة على أداء مهام معقدة وديناميكية. صفحة المشروع: https://kaijwang.github.io/odyssey.github.io/