HyperAIHyperAI
منذ 16 أيام

أوكتو: سياسة روبوت عامة مفتوحة المصدر

Octo Model Team, Dibya Ghosh, Homer Walke, Karl Pertsch, Kevin Black, Oier Mees, Sudeep Dasari, Joey Hejna, Tobias Kreiman, Charles Xu, Jianlan Luo, You Liang Tan, Pannag Sanketi, Quan Vuong, Ted Xiao, Dorsa Sadigh, Chelsea Finn, Sergey Levine
أوكتو: سياسة روبوت عامة مفتوحة المصدر
الملخص

السياسات الكبيرة المُدرَّبة مسبقًا على مجموعات بيانات متعددة للروبوتات تمتلك القدرة على تحويل تعلُّم الروبوتات: بدلًا من تدريب سياسات جديدة من الصفر، يمكن تحسين هذه السياسات العامة للروبوتات باستخدام كميات قليلة فقط من البيانات الخاصة بالمجال، مع الحفاظ على قدرة تعميم واسعة النطاق. ومع ذلك، لكي تكون هذه السياسات قابلة للتطبيق على نطاق واسع في مختلف سيناريوهات تعلُّم الروبوتات، والبيئات، والمهام، فإنها تحتاج إلى التعامل مع أحاسيس متنوعة ومساحات إجرائية متفاوتة، ودعم مجموعة متنوعة من المنصات الروبوتية الشائعة، بالإضافة إلى إمكانية التحسين السريع والفعال لبيئات جديدة. في هذا العمل، نهدف إلى وضع الأسس لتطوير سياسات عامة مفتوحة المصدر، قابلة للتطبيق على نطاق واسع، للتحكم في الروبوتات. كخطوة أولى، نقدّم "أوكتو" (Octo)، وهي سياسة تعتمد على نموذج تحويلي كبير (Transformer) تم تدريبها على 800 ألف مسار من مجموعة بيانات Open X-Embodiment، وهي أكبر مجموعة بيانات للتحكم في الروبوتات حتى الآن. يمكن توجيهها عبر أوامر لغوية أو صور أهداف، ويمكن تحسينها بكفاءة لبيئات روبوتية جديدة تتميز بمدخلات حسية ومساحات إجرائية مختلفة خلال بضع ساعات فقط على وحدات معالجة رسومية استهلاكية عادية. وقد أظهرت تجاربنا على 9 منصات روبوتية أن أوكتو تعمل كمُبَدِّئ سياسة متنوعة يمكن تحسينها بكفاءة لمساحات مراقبة وإجرائية جديدة. كما قمنا بتحليلات مفصلة لقرارات التصميم الخاصة بنموذج أوكتو، بدءًا من البنية المعمارية وصولاً إلى بيانات التدريب، لتوجيه الأبحاث المستقبلية في بناء نماذج روبوتية عامة.

أوكتو: سياسة روبوت عامة مفتوحة المصدر | أحدث الأوراق البحثية | HyperAI