HyperAIHyperAI
منذ 17 أيام

LADMIM: الكشف عن الشذوذ المنطقي باستخدام نمذجة الصورة المُقنعة في الفضاء المخفي المتقطع

Shunsuke Sakai, Tatushito Hasegawa, Makoto Koshino
LADMIM: الكشف عن الشذوذ المنطقي باستخدام نمذجة الصورة المُقنعة في الفضاء المخفي المتقطع
الملخص

لكشف الظواهر غير الطبيعية مثل التراكيب الخاطئة للمواد أو الانحرافات في مواقفها، يُعدّ التحدي الأكبر في كشف الشذوذ الصناعي. تركز الطرق التقليدية بشكل رئيسي على السمات المحلية للصور الطبيعية، مثل الخدوش والأوساخ، مما يجعل كشف الشذوذ في العلاقات بين السمات أمرًا صعبًا. إن نمذجة الصورة المُقنّعة (MIM) هي تقنية للتعلم الذاتي تهدف إلى توقع تمثيل السمة للمناطق المقنعة في الصورة. ولإعادة بناء المناطق المقنعة، يصبح من الضروري فهم كيفية تكوين الصورة، مما يمكّن من تعلّم العلاقات بين السمات داخل الصورة. نقترح منهجًا جديدًا يستفيد من خصائص MIM للكشف الفعّال عن الشذوذ المنطقي. وللتغلب على ضبابية الصورة المُعاد بناؤها، نستبدل توقع القيم البكسلية بتنبؤ بتوزيع الاحتمالات الخاص بمتغيرات متخزنة منفصلة للمناطق المقنعة باستخدام "مُحوّل" (tokenizer). وقد قُمنا بتقييم المنهج المقترح على مجموعة بيانات MVTecLOCO، حيث حقق متوسط AUC قدره 0.867، متفوقًا على الطرق التقليدية القائمة على إعادة البناء والطرق القائمة على التقطيع (distillation).

LADMIM: الكشف عن الشذوذ المنطقي باستخدام نمذجة الصورة المُقنعة في الفضاء المخفي المتقطع | أحدث الأوراق البحثية | HyperAI