GLAD: نحو إعادة بناء أفضل من خلال نماذج التشتت المتكيفة عالميًا ومحليًا لنمذجة الكشف غير المراقب عن الشذوذ

أظهرت نماذج التشتت أداءً متفوقًا في مهام الكشف عن الشذوذ غير المراقب. وبما أن هذه النماذج تُدرَّب فقط على بيانات طبيعية، فإنها تميل إلى إعادة بناء الصور الطبيعية المقابلة للصور المختبرة مع إضافة ضوضاء معينة. ومع ذلك، فإن هذه الأساليب تتعامل مع جميع الشذوذ المحتملة بشكل متساوٍ، مما قد يؤدي إلى مشكلتين رئيسيتين. من منظور عالمي، فإن صعوبة إعادة بناء الصور التي تحتوي على شذوذ مختلفة ليست متساوية. لذا، بدلًا من استخدام نفس الإعداد لجميع العينات، نقترح التنبؤ بخطوة معينة لإزالة الضوضاء لكل عينة من خلال تقييم الفرق بين محتوى الصورة والمعطيات المستخرجة من نماذج التشتت. ومن منظور محلي، تختلف عملية إعادة بناء المناطق الشاذة عن المناطق الطبيعية حتى في نفس الصورة. نظريًا، تتنبأ نماذج التشتت بضوضاء لكل خطوة، وعادةً ما تتبع توزيعًا طبيعيًا قياسيًا. لكن بسبب الفرق بين الشذوذ ونظيره الطبيعي المحتمل، فإن الضوضاء المتنبأ بها في المناطق الشاذة ستخرج بالضرورة عن توزيع الطبيعي القياسي. ولحل هذه المشكلة، نقترح إدخال عينات شاذة مُصَنَّعة أثناء التدريب لتشجيع نماذج التشتت على التغلب على قيد التوزيع الطبيعي القياسي، كما نستخدم خطة تكامل ميزات مُعدَّلة حسب الموقع أثناء الاستدلال. وباستخدام هذه التعديلات، نقترح نموذجًا تشتتيًا متكيفًا عالميًا ومحليًا (يُختصر إلى GLAD) للكشف عن الشذوذ غير المراقب، والذي يُدخل مرونة جذابة ويحقق إعادة بناء خالية من الشذوذ مع الحفاظ على أكبر قدر ممكن من المعلومات الطبيعية. أجرينا تجارب واسعة على ثلاث مجموعات بيانات شائعة للكشف عن الشذوذ (MVTec-AD، MPDD، وVisA) بالإضافة إلى مجموعة بيانات لوحات الدوائر المطبوعة (PCB-Bank) التي قمنا بدمجها، مما يُظهر فعالية الطريقة المقترحة.