التدريب البصري المُقنَّع للتحكم الحركي

يُظهر هذا البحث أن التدريب البصري ذاتي التوجيه من خلال الصور الواقعية يُعد فعّالاً في تعلّم مهام التحكم الحركي من خلال البكسلات. نبدأ أولاً بتدريب التمثيلات البصرية باستخدام نموذج التغطية للصور الطبيعية. ثم نجمّد المشفر البصري ونُدرّب مُتحكمات الشبكة العصبية فوقه باستخدام التعلم التعلّمي. لا نُجري أي تعديل دقيق مخصص للمهمة على المشفر؛ بل نستخدم نفس التمثيلات البصرية لجميع مهام التحكم الحركي. إلى حد معرفتنا، فإن هذا النموذج الذاتي التوجيه هو الأول الذي يستخدم الصور الواقعية على نطاق واسع لتحسين التحكم الحركي. ولتسريع التقدم في التعلّم من البكسلات، نقدّم مجموعة معايير مُصممة يدويًا من المهام التي تختلف في الحركات، والمشاهد، والروبوتات. وبلا اعتماد على التصنيفات، أو تقدير الحالة، أو التدريبات الخبيرة، نتفوّق باستمرار على المشفرات المُدرّبة بطرق مراقبة بنسبة تصل إلى 80% في معدل النجاح المطلق، وفي بعض الحالات نصل إلى أداء يُشبه أداء الحالة المثالية (الأوراكل). كما وجدنا أن الصور الواقعية، مثل تلك المستمدة من يوتيوب أو مقاطع الفيديو ذات المنظور الشخصي (Egocentric)، تُنتج تمثيلات بصرية أفضل لعدة مهام للتعامل والتمويه مقارنةً بصور ImageNet.