HyperAIHyperAI
منذ 17 أيام

كشف التعرض للقيم الشاذة: ما يمكن تعلمه من عدد قليل من الصور الشاذة، أو صورة واحدة، أو حتى لا صور شاذة على الإطلاق

Philipp Liznerski, Lukas Ruff, Robert A. Vandermeulen, Billy Joe Franks, Klaus-Robert Müller, Marius Kloft
كشف التعرض للقيم الشاذة: ما يمكن تعلمه من عدد قليل من الصور الشاذة، أو صورة واحدة، أو حتى لا صور شاذة على الإطلاق
الملخص

نظرًا لصعوبة تحديد كل ما يبدو غير طبيعي بالنسبة للبيانات العادية، يُعامل اكتشاف الشذوذ (AD) تقليديًا كمشكلة غير مراقبة، تستخدم فقط عينات عادية. ومع ذلك، تم مؤخرًا اكتشاف أن يمكن تحسين اكتشاف الشذوذ في الصور غير المراقبة بشكل كبير من خلال استخدام مجموعات ضخمة من الصور العشوائية لتمثيل الشذوذ؛ وهي تقنية تُعرف بـ "عرض الخارجة" (Outlier Exposure). في هذا البحث، نُظهر أن الطرق المخصصة لتعلم اكتشاف الشذوذ تبدو غير ضرورية لتحقيق الأداء المتميز، وأنه يمكن تحقيق أداء قوي باستخدام مجرد مجموعة صغيرة من بيانات "عرض الخارجة"، مما يناقض الافتراضات الشائعة في مجال اكتشاف الشذوذ. وجدنا أن المصنفات القياسية والطرق شبه المراقبة ذات الفئة الواحدة، التي تم تدريبها على التمييز بين العينات العادية والصور الطبيعية العشوائية القليلة، قادرة على التفوق على الحد الأقصى الحالي للأداء على معيار معياري مُثبت لـ AD باستخدام ImageNet. كما كشفت تجارب إضافية أن عينة شاذة واحدة مختارة بعناية تكون كافية لتحقيق أداء مقبول على هذا المعيار (79.3% AUC). ونقوم بدراسة هذا الظاهرة، ونجد أن الطرق ذات الفئة الواحدة تكون أكثر مقاومة لاختيار العينات الشاذة المستخدمة في التدريب، مما يشير إلى أن هناك سيناريوهات يكون فيها هذا النوع من الطرق أكثر فائدة من المصنفات القياسية. علاوة على ذلك، نقدم تجارب توضح السياقات التي تظل فيها نتائجنا صحيحة. وأخيرًا، لا تتطلب أي عينات تدريبية عند استخدام التمثيلات المستمدة من نموذج الأساس الحديث CLIP، الذي يحقق نتائج قياسية في اكتشاف الشذوذ على CIFAR-10 وImageNet في بيئة بدون تدريب (zero-shot).

كشف التعرض للقيم الشاذة: ما يمكن تعلمه من عدد قليل من الصور الشاذة، أو صورة واحدة، أو حتى لا صور شاذة على الإطلاق | أحدث الأوراق البحثية | HyperAI