تعلم كيفية التعلم: التنقل البصري الذاتي التكيفي باستخدام التعلم الميتا

التعلم هو ظاهرة مستمرة بطبيعتها. عند تعلم البشر مهمة جديدة، لا يوجد تمييز صريح بين التدريب والاستدلال. بينما نتعلم المهمة، نستمر في تعلم المزيد عنها أثناء أداء المهمة. ما نتعلمه وكيفية تعلمنا يختلف خلال مراحل مختلفة من التعلم. تعلم كيفية التعلم والتكيف هو خاصية أساسية تمكّننا من التعميم بسهولة على الإعدادات الجديدة. وهذا يختلف عن الإعدادات التقليدية في التعلم الآلي حيث يتم تجميد النموذج المدرب أثناء الاستدلال. في هذه الورقة، ندرس مشكلة التعلم للتعلم في كل من وقت التدريب ووقت الاختبار في سياق التنقل البصري. أحد التحديات الأساسية في التنقل هو التعميم إلى المشاهد غير المرئية سابقًا. في هذه الورقة، نقترح طريقة تنقل بصري ذاتي-تكيف (SAVN) والتي تتعلم كيفية التكيف مع بيئات جديدة دون أي إشراف صريح. حلنا هو نهج تعليم تعزيز متقدم حيث يقوم العميل بتعلم دالة خسارة تفاعل ذاتي-إشراف تشجع على التنقل الفعال. أظهرت تجاربنا التي أجريت في إطار AI2-THOR تحسينات كبيرة في معدل النجاح وفي SPL للتنقل البصري في المشاهد الجديدة. كودنا وبياناتنا متاحة على الرابط: https://github.com/allenai/savn .