تجاوز التقاط والوضع: مواجهة تكدس الأشكال المتنوعة بواسطة الروبوتات

ندرس مشكلة تجميع الروبوتات باستخدام الأجسام ذات الهندسة المعقدة. نقترح مجموعة متنوعة ومليئة بالتحديات من هذه الأجرام، والتي تم تصميمها بعناية لتطالب باستراتيجيات تتجاوز الحل البسيط "التقاط والوضع" (pick-and-place). طريقتنا تعتمد على تعليم التدعيم (reinforcement learning) مدمجًا مع تقليص السياسات التفاعلية القائمة على الرؤية ونقل المحاكاة إلى الواقع. يمكن للسياسات التي تعلمناها التعامل بكفاءة مع تركيبات متعددة للأجسام في العالم الحقيقي وتظهر مجموعة كبيرة ومتنوعة من مهارات التجميع. في دراسة تجريبية واسعة النطاق، نستكشف ما هي الخيارات التي تهم لتعلم مثل هذه الوكلاء القائمين على الرؤية في المحاكاة وما الذي يؤثر على النقل الأمثل إلى الروبوت الحقيقي. ثم نستفيد من البيانات التي جمعتها هذه السياسات ونحسن منها باستخدام تعليم التدعيم غير المباشر (offline RL). تم توفير فيديو ومقالة مدونة كمواد إضافية لعملنا.