الشبكات الممرّة الشرطية المُحكَمة للتعلم المستمر المُدرك للمهمة

تُعاني الشبكات العصبية التلافيفية (Convolutional Neural Networks) من نسيان كارثي عند تحسينها على تسلسل من مسائل التعلم: فعندما تحقق الشبكة الهدف من أمثلة التدريب الحالية، تنخفض أداؤها بشكل كبير على المهام السابقة. في هذا العمل، نُقدّم إطارًا جديدًا لمعالجة هذه المشكلة باستخدام الحوسبة الشرطية. نزوّد كل طبقة تلافيفية بوحدات توجيه مخصصة للمهام، تُحدد أي مرشحات ينبغي تطبيقها على المدخلات المعطاة. وبهذا نحقق خاصيتين جذابتين. أولاً، تُمكّن أنماط التشغيل الخاصة بالوحدات من تحديد المرشحات المهمة وحمايتها، مما يضمن عدم حدوث فقدان في أداء النموذج بالنسبة للمهام السابقة التي تم تعلّمها. ثانيًا، وباستخدام هدف ندرة (sparsity objective)، يمكننا تعزيز اختيار مجموعة محدودة من النوى (kernels)، مما يسمح بالحفاظ على قدرة كافية للنموذج لاستيعاب المهام الجديدة. أما الحلول الحالية، فهي تتطلب في وقت الاختبار معرفة المهمة التي تنتمي إليها كل مثال، وهو ما قد لا يكون متوفرًا في العديد من السيناريوهات العملية. ولذلك، نقدّم إضافةً وحدة تصنيف للمهام تتنبأ بعلامة المهمة لكل مثال، لمعالجة الحالات التي لا تكون فيها هناك "مُحْكَمَة مهمة" (task oracle) متاحة. ونختبر اقتراحنا على أربع مجموعات بيانات للتعلم المستمر. وتُظهر النتائج أن نموذجنا يتفوّق باستمرار على الطرق القائمة، سواء في وجود أو غياب مُحْكَمَة مهمة. وبشكل ملحوظ، على مجموعتي بيانات Split SVHN وImagenet-50، حقق نموذجنا تحسينًا يصل إلى 23.98% و17.42% في الدقة مقارنة بالطرق المنافسة.