التعلم المستمر القائم على عدم اليقين مع التنظيم التكيفي

نقدم خوارزمية تعلم مستمر جديدة تعتمد على الشبكات العصبية، والتي أطلقنا عليها اسم التعلم المستمر المنظم بالشكوك (UCL)، وهي تستند إلى الإطار التقليدي للتعلم البيزي عبر الإنترنت باستخدام الاستدلال المتغير. نركز في هذا البحث على مشكلتين رئيسيتين في الطرق المعتمدة على التنظيم التي تم اقتراحها مؤخرًا: أ) التكلفة الذاكرة الإضافية الكبيرة لتحديد قوة التنظيم لكل وزن، وب) غياب نظام نسيان مرن يمكن أن يمنع تدهور الأداء عند تعلم المهام الجديدة. في هذه الورقة، نوضح كيف يمكن لـ UCL حل هاتين المشكلتين من خلال تقديم تفسير جديد لمصطلح الاختلاف كولباك-لايب勒 (KL) في الحد السفلي المتغير للمتوسط الحقل الجاوس. بناءً على هذا التفسير، نقترح مفهوم عدم اليقين حسب العقدة، مما يقلل بشكل كبير من عدد المعلمات الإضافية اللازمة لتنفيذ التنظيم لكل وزن. بالإضافة إلى ذلك، قمنا بتصميم مصطلحين إضافيين للتنظيم يضمان الاستقرار من خلال تجميد المعلمات الهامة للمهام السابقة والسماح بالمرونة من خلال التحكم في المعلمات النشطة التي يتم تعلمها لمهمة جديدة. من خلال التجارب الواسعة، أظهرنا أن UCL يتفوق بشكل مقنع على معظم الأساليب الرائدة حديثًا ليس فقط في مقاييس التعلم الإشرافي الشائعة ولكن أيضًا في مهام التعلم التعزيزي المستمر الصعبة. شفرة المصدر لخوارزميتنا متاحة على الرابط https://github.com/csm9493/UCL.