خسارة التباين المنقولة للوسط للكشف عن الشذوذ

تتعلم طرق الكشف عن الشذوذ العميقة تمثيلات تفصل بين الصور الطبيعية والشاذة. وعلى الرغم من أن تعلم التمثيل الذاتي المُدرَّب يُستخدم بشكل شائع، إلا أن حجم المجموعات الصغيرة من البيانات يحد من فعاليته. وقد أُظهر سابقًا أن استخدام مجموعات بيانات خارجية عامة (مثل مجموعة بيانات ImageNet للتصنيف) يمكن أن يحسن بشكل كبير أداء الكشف عن الشذوذ. إحدى الطرق هي "عرض المُنفَرِدات" (outlier exposure)، ولكنها تفشل عندما لا تشبه مجموعات البيانات الخارجية الشذوذ. نتبع نهج نقل التمثيلات المُدرَّبة مسبقًا على مجموعات بيانات خارجية لغرض الكشف عن الشذوذ. ويمكن تحسين أداء الكشف عن الشذوذ بشكل كبير من خلال تحسين التمثيلات المُدرَّبة مسبقًا باستخدام الصور الطبيعية في التدريب. في هذه الورقة، نُظهر ونحلل أولًا أن التعلم التبايني، وهو النموذج الأكثر شيوعًا في التعلم الذاتي المُدرَّب، لا يمكن تطبيقه بشكل مباشر على الميزات المُدرَّبة مسبقًا. والسبب هو أن التهيئة الأولية للخصائص المُدرَّبة مسبقًا تؤدي إلى حالة تحسين سيئة بالنسبة للوظائف التباينية القياسية، مما يسبب ديناميكيات تحسين غير جيدة. استنادًا إلى تحليلنا، نقدّم وظيفة تباين معدلة تُسمى "خسارة التباين المنزَّلة متوسطًا" (Mean-Shifted Contrastive Loss). وتُظهر طريقتنا فعالية عالية، وتحقيق أداء جديد في مستوى الحد الأقصى للكشف عن الشذوذ، بما في ذلك تقييم ROC-AUC بنسبة 98.6٪ على مجموعة بيانات CIFAR-10.