التعلم النشط ضمن الميزانية: تُناسب الاستراتيجيات المعاكسة الميزانيات العالية والمنخفضة

في دراسة التعلم النشط، نركّز على العلاقة بين عدد الأمثلة المُعلّمة (حجم الميزانية) واستراتيجيات الاستفسار المناسبة. تُظهر تحليلاتنا النظرية سلوكًا يشبه الانتقال الطوري: فالأمثلة النموذجية تكون أفضل في الاستفسار عندما تكون الميزانية منخفضة، بينما تكون الأمثلة غير الممثلة هي الأفضل في الاستفسار عندما تكون الميزانية كبيرة. وتُقدّم الأدلة المجمعة دليلاً على حدوث ظاهرة مشابهة في نماذج التصنيف الشائعة. وبناءً عليه، نقترح "TypiClust" — استراتيجية تعلم نشط عميق مناسبة للميزانيات المنخفضة. في دراسة تجريبية مقارنة للتعلم المُشرف، باستخدام مجموعة متنوعة من البنية المعمارية ومحفظات بيانات الصور، تتفوّق "TypiClust" على جميع استراتيجيات التعلم النشط الأخرى في نطاق الميزانيات المنخفضة. كما أن أداء النماذج شبه المُشرفة يتحسّن بشكل أكبر عند استخدام "TypiClust". وتحديدًا، تصل النماذج الرائدة في مجال التعلم شبه المُشرف، المدربة على مجموعة بيانات CIFAR-10 باستخدام 10 أمثلة مُختارة بواسطة "TypiClust"، إلى دقة قدرها 93.2% — أي تحسّن بنسبة 39.4% مقارنة باختيار عشوائي. يُمكن الاطلاع على الكود على الرابط: https://github.com/avihu111/TypiClust.