التوسع في وقت التدريب وتحسين الكشف التلقائي عن التوزيعات الخارجة عن المجموعة الملاحظة

قدرة النظام الحديث للتعلم العميق على تحديد ما إذا كان العينة تنتمي إلى نطاق معرفته أمر أساسي وحاسم. في هذه الورقة، نقدّم رؤى وتحليلات حول أحدث الأساليب المتطورة للكشف عن البيانات الخارجة عن التوزيع (OOD)، وخاصة طريقة التشكيل النشاطي البسيطة جدًا (ASH). نُظهر أن عملية تقليل النشاط (activation pruning) تؤثر سلبًا على كفاءة الكشف عن البيانات الخارجة عن التوزيع، بينما يعزز التحجيم النشاطي (activation scaling) هذه الكفاءة. علاوة على ذلك، نقترح طريقة SCALE، وهي طريقة بسيطة ولكنها فعّالة لتحسين الشبكة بعد التدريب (post-hoc) للكشف عن البيانات الخارجة عن التوزيع، وتُحقّق أداءً متميزًا على مستوى الحالة الراهنة دون التضحية بدقة البيانات ضمن التوزيع (ID). من خلال دمج مفاهيم التحجيم في عملية التدريب لالتقاط الخصائص المرتبطة بالبيانات ضمن التوزيع، نقترح طريقة التشكيل المتوسط للتوسّع (ISH)، وهي طريقة خفيفة الوزن لتحسين الكشف عن البيانات الخارجة عن التوزيع أثناء التدريب. وحققنا تحسينات في مؤشر AUROC بنسبة +1.85% للبيانات القريبة من OOD، و+0.74% للبيانات البعيدة عن OOD، على معيار OpenOOD v1.5 الخاص بـ ImageNet-1K. يُمكن الاطلاع على الشفرة والنماذج التي نقدّمها من خلال الرابط التالي: https://github.com/kai422/SCALE.