HyperAI
منذ 2 أيام

هل التنوع كل ما تحتاجه للمناولة الروبوتية القابلة للتوسع؟

Modi Shi, Li Chen, Jin Chen, Yuxiang Lu, Chiming Liu, Guanghui Ren, Ping Luo, Di Huang, Maoqing Yao, Hongyang Li
هل التنوع كل ما تحتاجه للمناولة الروبوتية القابلة للتوسع؟
الملخص

لقد أدت مасكّلة البيانات إلى تحقيق نجاحات ملحوظة في النماذج الأساسية لمعالجة اللغة الطبيعية (NLP) ورؤية الحاسوب (CV)، ومع ذلك، فإن مبادئ تطبيق ماسكّلة البيانات بشكل فعّال في التلاعب الروبوتي لا تزال غير كافية الفهم. في هذا البحث، ندرس الدور الدقيق لمتنوعية البيانات في تعلم الروبوت من خلال فحص ثلاثة أبعاد حرجة: المهمة (ماذا يجب فعله)، الشكل المادي (أي روبوت يستخدم)، والخبير (من يُقدم المثال)—متحديين الفهم التقليدي القائل بأن "المزيد من التنوع أفضل". عبر سلسلة من التجارب الواسعة على منصات روبوتية مختلفة، نكشف أن (1) تنوع المهام أكثر أهميةً من كمية الأمثلة لكل مهمة، مما يفيد النقل من مهام التدريب الأولي المتنوعة إلى سيناريوهات جديدة لاحقة؛ (2) بيانات التدريب الأولي متعددة الأشكال المادية اختيارية للنقل بين الأشكال المادية—فيمكن للنماذج التي تم تدريبها على بيانات عالية الجودة لشكل مادي واحد أن تتواصل بكفاءة مع المنصات المختلفة، وتظهر خصائص توسع أكثر مرغوبة أثناء التعديل الدقيق مقارنةً بالنماذج التي تم تدريبها على بيانات متعددة الأشكال المادية؛ و(3) تنوع الخبراء، الذي ينشأ من تفضيلات تشغيلية فردية وتغيرات عشوائية في أمثلة البشر، يمكن أن يكون مضللاً لتعلم السياسات، حيث يظهر التنوع المتعدد في السرعة كعامل أساسي مساهم. بناءً على هذه الرؤى، نقترح طريقة لتخفيف الانحياز التوزيعي لتقليل الغموض في السرعة، مما يؤدي إلى تحقيق GO-1-Pro زيادة في الأداء بنسبة 15%، ما يعادل استخدام 2.5 مرة بيانات التدريب الأولي. مجتمعةً، توفر هذه النتائج وجهات نظر جديدة وتقدم إرشادات عملية حول كيفية توسيع قواعد البيانات للتلاعب الروبوتي بشكل فعال.