التعلم الميتا دون تذكّر

القدرة على تعلّم مفاهيم جديدة باستخدام كميات صغيرة من البيانات تمثل جانبًا حاسمًا من الذكاء، وقد أثبتت صعوبة كبيرة أمام أساليب التعلم العميق. ظهر التعلّم الميتا (Meta-learning) كتقنية واعدة تُستخدَم لاستغلال البيانات من المهام السابقة لتمكين التعلّم الفعّال للمهام الجديدة. ومع ذلك، تتطلب معظم خوارزميات التعلّم الميتا بشكل ضمني أن تكون المهام المستخدمة في التدريب الميتا متعارضة بذاتها، بحيث لا يمكن لنموذج واحد حل جميع المهام في آن واحد. على سبيل المثال، عند إنشاء مهام لتصنيف الصور بعينة صغيرة (few-shot)، يستخدم البحث السابق تعيينًا عشوائيًا لكل فئة صورة إلى تصنيفات من نوع N-way. إذا لم يُطبّق هذا الشرط، يمكن للنموذج الميتا تجاهل بيانات التدريب الخاصة بالمهام والتعلم على نموذج واحد يُنفّذ جميع مهام التدريب الميتا دون تدريب (zero-shot)، لكنه لا يتكيف بكفاءة مع فئات صور جديدة. هذا الشرط يعني أن على المستخدم أن يُولي اهتمامًا كبيرًا في تصميم المهام، مثلاً من خلال خلط التسميات أو إزالة المعلومات التمييزية للمهام من المدخلات. وفي بعض المجالات، يصبح التعلّم الميتا غير قابل للتطبيق تمامًا. في هذه الورقة، نعالج هذه التحديات من خلال تصميم دالة تنظيم ميتا تعتمد على نظرية المعلومات، وتُعطي الأولوية للتكيف القائم على البيانات. يؤدي هذا إلى تمكين النموذج الميتا من اتخاذ قرار حول ما يجب تعلّمه من بيانات تدريب المهمة وما ينبغي استخلاصه من المدخلات الخاصة باختبار المهمة. وبذلك، يمكن لخوارزميتنا الاستفادة بنجاح من بيانات المهام غير المتعارضة بذاتها لتكيف فعّال مع مهام جديدة. نُظهر تطبيقها على خوارزميات التعلّم الميتا القائمة على السياق (contextual) والخوارزميات القائمة على التدرج (gradient-based)، ونُطبّقها في بيئات عملية حيث كان تطبيق التعلّم الميتا القياسي صعبًا. ونُظهر أن نهجنا يتفوّق بشكل كبير على خوارزميات التعلّم الميتا القياسية في هذه البيئات.