التعلم التدريجي على نطاق واسع

يعاني التعلم الآلي الحديث من النسيان الكارثي عند تعلم فئات جديدة بشكل تدريجي. تنخفض الأداء بشكل كبير بسبب عدم وجود بيانات للفئات القديمة. تم اقتراح طرق للتعلم التدريجي للاحتفاظ بالمعرفة المكتسبة من الفئات القديمة، باستخدام تقنيات نقل المعرفة وإبقاء بعض الأمثلة من الفئات القديمة. ومع ذلك، فإن هذه الطرق تواجه صعوبة في التوسع إلى عدد كبير من الفئات. نعتقد أن السبب يكمن في مزيج من عاملين: (أ) عدم التوازن في البيانات بين الفئات القديمة والجديدة، و(ب) زيادة عدد الفئات المشابهة بصرياً. يعتبر تمييز الفئات المشابهة بصياً بشكل متزايد تحدياً خاصاً عندما تكون بيانات التدريب غير متوازنة. نقترح طريقة بسيطة وفعالة لمعالجة مشكلة عدم التوازن في البيانات. وجدنا أن الطبقة المتصلة بالكامل الأخيرة لديها تحيز قوي نحو الفئات الجديدة، ويمكن تصحيح هذا التحيز باستخدام نموذج خطي. باستخدام معلمتين للتحيز، أظهرت طريقتنا أداءً ملحوظاً على قاعدتين كبيرتين للبيانات: ImageNet (1000 فئة) و MS-Celeb-1M (10000 فئة)، حيث تفوقت على الخوارزميات الرائدة بنسبة 11.1% و 13.2% على التوالي.