GeneralAD: الكشف عن الشذوذ عبر المجالات من خلال التركيز على السمات المشوهة

في مجال الكشف عن الشذوذ، تُظهر الطرق غالبًا تميّزًا كبيرًا إما في المعايير عالية المستوى الدلالية أو في المعايير الصناعية منخفضة المستوى، ولكنها نادرًا ما تحقق كفاءة عبر المجالات المختلفة. فالشذوذ الدلالي يُمثل حالات جديدة تختلف من حيث المعنى عن مجموعة التدريب، مثل الأجسام غير المرئية في السيارات ذاتية القيادة. في المقابل، يُعد الشذوذ الصناعي عيوبًا خفية تُبقي على المعنى الدلالي، مثل الشقوق في مكونات الطائرات. في هذه الورقة، نقدّم GeneralAD، وهي إطار عمل للكشف عن الشذوذ مصمم للعمل في البيئات الدلالية، والقريبة من التوزيع، والصناعية، مع الحاجة إلى تعديلات قليلة جدًا لكل مهمة. في نهجنا، نستفيد من التصميم الداخلي لمحولات الرؤية (Vision Transformers)، التي تُدرّب على قطع الصور، مما يضمن بقاء الحالات المخفية الأخيرة ببنية قائمة على القطع. نقترح وحدة جديدة لتكوين الشذوذ ذاتيًا (self-supervised anomaly generation) تستخدم عمليات بسيطة مثل إضافة الضوضاء وخلط ميزات القطع لإنشاء عينات اصطناعية شاذة. تُقدّم هذه الميزات إلى مُميّز يعتمد على الانتباه (attention-based discriminator)، الذي يُدرّب على تقييم كل قطعة في الصورة. وبهذا، يمكن لطريقتنا تحديد الشذوذ بدقة على مستوى الصورة، كما تُنتج خرائط شذوذ قابلة للتفسير. تم تقييم نهجنا بشكل واسع على عشرة مجموعات بيانات، حيث حقق أداءً متقدمًا (state-of-the-art) في ستة منها، وأداءً مماثلًا للمنافسين في البقية، سواء في مهام التمييز أو التحليل المكاني.