HyperAIHyperAI
منذ 2 أشهر

تعلم التسلسلات الفعلية الذاتية الانحدار لعمليات التحكم الروبوتية

Xinyu Zhang; Yuhan Liu; Haonan Chang; Liam Schramm; Abdeslam Boularias
تعلم التسلسلات الفعلية الذاتية الانحدار لعمليات التحكم الروبوتية
الملخص

تصميم هندسة سياسة عالمية تؤدي بشكل جيد عبر روبوتات متنوعة وتكوينات مهام مختلفة يظل تحديًا رئيسيًا. في هذا العمل، نعالج هذه المشكلة من خلال تمثيل أفعال الروبوت كبيانات متسلسلة وإنتاج الأفعال من خلال نمذجة المتتاليات الذاتية الانحدار. تتولد الهياكل الذاتية الانحدار الحالية نقاط الوصول النهائية للروبوت بشكل متسلسلي كرموز كلمات في نمذجة اللغة، وهي محدودة عند التعامل مع مهام التحكم ذات التردد المنخفض. على عكس اللغة، تكون أفعال الروبوت غير متجانسة وتشمل غالبًا قيمًا مستمرة - مثل مواقع المفاصل، إحداثيات البكسل ثنائية الأبعاد، وأوضاع نقاط الوصول النهائية - والتي لا تناسب بسهولة النمذجة القائمة على اللغة. بناءً على هذه الرؤية، نقدم تعديلًا بسيطًا: نوسع تنبؤ العناصر الفردية للمتحولات السببية لدعم تنبؤ عدد متغير من العناصر في خطوة واحدة من خلال محول الكتل السببي (CCT). يتيح هذا التعديل الأداء القوي عبر مهام متنوعة ذات ترددات تحكم مختلفة، الكفاءة الأكبر عن طريق تقليل عدد خطوات الانحدار الذاتي، ويؤدي إلى تصميم متتابع للأفعال الهجينة من خلال خلط أنواع مختلفة من الأفعال واستخدام حجم كتلة مختلف لكل نوع من الأفعال. بناءً على CCT، نقترح هندسة السياسة الذاتية الانحدار (ARP)، التي تحل مشاكل التلاعب بإنتاج متتابع للأفعال الهجينة. نقيم ARP عبر بيئات متنوعة للتلاعب الروبوتي، بما في ذلك Push-T وALOHA وRLBench، ونظهر أن ARP كهندسة عالمية تتوافق أو تتفوق على أفضل التقنيات الخاصة بالبيئة في جميع المقاييس التي تم اختبارها، بينما تكون أكثر كفاءة في الحساب والحجم المعلمي. يمكن العثور على مقاطع الفيديو لأداء الروبوت الحقيقي لدينا وكود المصدر الكامل والنماذج المدربة سلفًا لـ ARP على الرابط http://github.com/mlzxy/arp.

تعلم التسلسلات الفعلية الذاتية الانحدار لعمليات التحكم الروبوتية | أحدث الأوراق البحثية | HyperAI