الاستخلاص المنفصل ثنائي النموذج للكشف غير المراقب عن الشذوذ

الاستخلاص المعرفي القائم على شبكة الطالب-المعلم يُعد أحد النماذج الرئيسية لحل مهمة الكشف غير المراقبة عن الشذوذ، حيث يستخدم الفرق في قدرات التمثيل بين الشبكتين المعلّم والطالب لتنفيذ تحديد موقع الشذوذ. ومع ذلك، قد يؤدي التعميم الزائد للشبكة الطالب نحو الشبكة المعلّم إلى تقليل الفروق في قدرات التمثيل للشذوذ، مما يؤثر سلبًا على فعالية الكشف. تسعى الطرق الحالية للتعامل مع احتمالية التعميم الزائد من خلال استخدام طلاب ومعلمين مختلفين من منظور هيكلية، أو توسيع المعلومات المستخلصة بشكل صريح من منظور المحتوى، وهي أمور تؤدي حتمًا إلى احتمال أكبر لحدوث نقص في التكيّف (underfitting) في الشبكة الطالب، وضعف قدرتها على كشف الشذوذ في مناطق المركز أو الحافة. في هذه الورقة، نقترح منهجية DMDD (الاستخلاص المُفصَّل المزدوج النموذجي) للكشف غير المراقب عن الشذوذ. في DMDD، نُقدّم شبكة طالب-معلم مُفصَّلة، تُفصِّل السمات الأولية للطالب إلى سمات عادية وسمات غير عادية. كما نُقدّم مبدأ الاستخلاص المزدوج القائم على أزواج الصور العادية والشاذة، بحيث يتم مواءمة سمات العدمية في الصور الشاذة مع سمات المعلم في الصور العادية المقابلة، مما يوسع الفجوة بين سمات الشذوذ وسمات المعلم في المناطق الشاذة. وبدمج هذين المبدأين في الاستخلاص، نحقق كشفًا عن الشذوذ يركّز على كل من مركز الشذوذ وحافته. وأخيرًا، نُقدّم شبكة تجزئة متعددة الإدراكية لإنجاز دمج خريطة الشذوذ بتركيز عالٍ بناءً على انتباه متعدد الطبقات. أظهرت النتائج التجريبية على مجموعة MVTec AD أن DMDD تتفوّق على أفضل الأداءات السابقة القائمة على الاستخلاص المعرفي، وتحقق 98.85% في مؤشر AUC على مستوى البكسل، و96.13% في مؤشر PRO.