DiffusionAD: تفتيت تدريجي موجه بالمعيار للكشف عن الشذوذ في خطوة واحدة

تم تبني الكشف عن الشذوذ على نطاق واسع في الصناعات التحويلية الحقيقية بفضل كفاءته وفعاليته المتميزة. ومع ذلك، كانت النماذج القائمة على التوليد السابقة محدودة جدًا بجودة إعادة البناء غير المثلى، مما أثر سلبًا على أدائها العام. نقدّم "DiffusionAD"، وهو نموذج جديد للكشف عن الشذوذ يتكوّن من شبكة إعادة بناء وشبكة تقسيم. تكمن الإضافة الأساسية في إعادة صياغة عملية إعادة البناء باستخدام نموذج التشتت (diffusion model) على شكل نموذج "من الضوضاء إلى القيمة القياسية" (noise-to-norm). في هذا النموذج، تفقد المنطقة الشاذة ملامحها المميزة بعد تعرّضها للاضطراب الناتج عن الضوضاء الغاوسية، ثم تُعاد بناؤها بشكل يخلو من الشذوذ. بعدها، تقوم شبكة التقسيم بتوقع نقاط الشذوذ على مستوى البكسل بناءً على التشابه والاختلاف بين الصورة المدخلة ونسخة إعادة البناء الخالية من الشذوذ. بالإضافة إلى ذلك، وبسبب التباطؤ الكبير في عملية الاستنتاج الناتج عن الطبيعة التكرارية لعملية إزالة الضوضاء في نماذج التشتت، نعيد النظر في عملية إزالة الضوضاء ونقدّم نموذجًا سريعًا يعتمد على خطوة واحدة لإزالة الضوضاء، والذي يحقق تسريعًا بمئات المرات مع الحفاظ على جودة إعادة البناء المماثلة. علاوة على ذلك، وباعتبار تنوع مظاهر الشذوذ، نقترح نموذجًا يُرشد بحسب القيمة القياسية (norm-guided paradigm) لدمج فوائد مجموعات مختلفة من مقاييس الضوضاء، مما يعزز دقة إعادة البناء. أظهرت التقييمات الشاملة على أربع معايير قياسية وصعبة أن DiffusionAD يتفوق على أحدث النماذج الحالية ويحقق سرعة استنتاج مماثلة، مما يُثبت فعالية وقابلية التطبيق الواسعة للنموذج المقترح. تم إتاحة الكود المصدر على الرابط: https://github.com/HuiZhang0812/DiffusionAD