توسيع هياكل الت convolution الشرطي لتعزيز التعلم المستمر متعدد المهام

حصلت العمليات الشرطية على اهتمام كبير في الدراسات الحديثة في التعلم العميق لتسهيل دقة التنبؤ النموذجية. أحد التطورات الحديثة في هذا الاتجاه هو الت convolution الشرطي المُعامَل (CondConv)، الذي تم اقتراحه لاستغلال القدرات الإضافية التي توفرها أوزان النموذج العميق لتحسين الأداء، مع التأثير المحدود على التعقيد الحسابي للنموذج. يعتمد CondConv على معاملات تجميع تعتمد على المدخلات، والتي يمكنها دمج عدة أعمدة من نوى الت convolution بشكل تكيفي لتحسين الأداء. أثناء التشغيل الفعلي، يتم دمج أعمدة النوى ديناميكيًا إلى عمود واحد، مما يجعل التعقيد الزمني أقل بكثير من استخدام عدة أعمدة في طبقة convolution تحت نفس القدرة. وعلى الرغم من فعالية CondConv في تحسين أداء النموذج العميق، فإنه يُطبَّق حاليًا فقط على مهام فردية. وبما أنه يتمتع بخاصية إضافة أوزان النموذج بفعالية حسابية جيدة، نمّد استخدامه لتعلم المهام المتعددة، حيث تُقدَّم المهام تدريجيًا. في هذا العمل، نقدّم نهجًا لتعلم المهام المتعددة التسلسلي (أو المستمر) مبنيًا على هيكل CondConv، يُعرف بـ CondConv-Continual. تُظهر النتائج التجريبية أن النهج المقترح فعّال في التعلم المستمر دون نسيان. مقارنةً بالطرق الحالية، يتميّز CondConv بتوفير طريقة منتظمة وسهلة التنفيذ لتوسيع الشبكات العصبية لاستيعاب قدرة إضافية، كما يوفر آلية تواصل متقاطع بين نماذج المهام المختلفة لتحقيق نتائج متماثلة.