الشبكات متعددة المهام المرنة من خلال تعلُّم تخصيص المعاملات

يُقدّم هذا البحث منهجًا جديدًا للتعلم في التطبيقات متعددة المهام. يمكن للشبكات العصبية متعددة المهام التعلّم على نقل المعرفة بين مهام مختلفة من خلال مشاركة المعلمات. ومع ذلك، فإن مشاركة المعلمات بين المهام غير المرتبطة قد تؤدي إلى تدهور الأداء. ولحل هذه المشكلة، نقترح إطارًا لتعلّم أنماط دقيقة لمشاركة المعلمات. بافتراض أن الشبكة تتكون من عدة مكونات عبر الطبقات، يستخدم إطارنا متغيرات ثنائية تم تعلّمها لتخصيص هذه المكونات للمهام، بهدف تعزيز مشاركة المعلمات بين المهام المرتبطة، وخفضها في غير ذلك. وتُدرَّس متغيرات التخصيص الثنائية مع معلمات النموذج بشكل مشترك باستخدام طريقة التدرج العكسي القياسي، بفضل تقنية إعادة التمثيل Gumbel-Softmax. وعند تطبيقه على معيار Omniglot، يحقق المنهج المقترح خفضًا نسبيًا بنسبة 17% في معدل الخطأ مقارنةً بأحدث الطرق المتطورة.