التعلم الميتا غير المرتبط بالنموذج للتكيف السريع لشبكات العمق

نقترح خوارزمية للتعلم الميتا (meta-learning) تكون مستقلة عن النموذج، بمعنى أنها متوافقة مع أي نموذج يتم تدريبه باستخدام الانحدار التدرجي (gradient descent) وقابلة للتطبيق على مجموعة متنوعة من مشكلات التعلم المختلفة، بما في ذلك التصنيف والتقدير والتعلم التعزيزي (reinforcement learning). هدف التعلم الميتا هو تدريب نموذج على مجموعة متنوعة من مهام التعلم بحيث يمكنه حل مهام تعلم جديدة باستخدام عدد قليل فقط من عينات التدريب. في نهجنا، يتم تدريب 매개변수 (parameters) للنموذج بشكل صريح بحيث يؤدي عدد قليل من خطوات الانحدار مع كمية صغيرة من بيانات التدريب من مهمة جديدة إلى أداء عام جيد في تلك المهمة. وبشكل فعال، فإن طريقتنا تقوم بتدريب النموذج ليكون سهلًا للتخصيص الدقيق (fine-tune). نظهر أن هذا النهج يؤدي إلى أداء رائد على محكمي تصنيف الصور القليل العينة (few-shot image classification)، ويحقق نتائج جيدة في تقدير القليل العينة (few-shot regression)، ويسرع عملية التخصيص الدقيق لتعلم التعزيز بالسياسات باستخدام سياسات الشبكات العصبية (neural network policies).