HyperAIHyperAI
منذ 3 أشهر

إعادة بناء الصورة من الصورة الحافة مع دمج اللون وفرق الميل للكشف عن الشوائب السطحية الصناعية

Tongkun Liu, Bing Li, Zhuo Zhao, Xiao Du, Bingke Jiang, Leqi Geng
إعادة بناء الصورة من الصورة الحافة مع دمج اللون وفرق الميل للكشف عن الشوائب السطحية الصناعية
الملخص

تُعدّ الطرق القائمة على إعادة البناء من أكثر الطرق استكشافًا في كشف الشذوذ البصري الصناعي. وعادةً ما تتطلب هذه الطرق من النموذج أن يُعيد بناء الأنماط الطبيعية بشكل جيد، لكنه يفشل في إعادة بناء الأنماط الشاذة، مما يسمح باكتشاف الشذوذ من خلال تقييم أخطاء إعادة البناء. ومع ذلك، في الممارسة العملية، من الصعب عادةً التحكم في حدود التعميم الخاصة بالنموذج. فعندما يكون لدى النموذج قدرة تعميم قوية جدًا، قد يُعيد بناء مناطق شاذة بشكل جيد، مما يجعلها أقل تمييزًا، بينما قد لا يُعيد بناء النموذج ذو القدرة الضعيفة على التعميم المكونات عالية التردد المتغيرة في المناطق الطبيعية، ما يؤدي في النهاية إلى نتائج إيجابية كاذبة. ولحل هذه المشكلة، نقترح شبكة إعادة بناء جديدة تقوم بإعادة بناء الصورة الأصلية بالقيمة اللونية (RGB) من حوافها الرباعية (EdgRec). يتم تحقيق ذلك من خلال مُشفّر تلقائي للإزالة من الضوضاء على نمط UNet مع اتصالات متعددة (skip connections). وتوفر الإدخالات الحافة والاتصالات المتقاطعة الحفاظ الجيد على المعلومات عالية التردد في الصورة الأصلية. وفي الوقت نفسه، يمكن للوظيفة المُقترحة لإعادة التكوين إجبار الشبكة على حفظ المعلومات منخفضة التردد واللون الطبيعية. علاوةً على ذلك، يمنع التصميم المُعتمد على إزالة الضوضاء من النموذج من نسخ المكونات عالية التردد في الصورة الأصلية بشكل مباشر. ولتقييم الشذوذ، نقترح أيضًا دالة تقييم مُصاغة يدويًا وقابلة للتفسير، تأخذ بعين الاعتبار الفروق في اللون والانحدار. وحققت طريقة العمل لدينا نتائج تنافسية على المعيار الصعب MVTec AD (97.8٪ للكشف و97.7٪ للتحديد، باستخدام AUROC). بالإضافة إلى ذلك، أجرينا تجارب على مجموعة بيانات MVTec 3D-AD وأظهرنا نتائج واعدة باستخدام صور RGB فقط. وسيكون الكود الخاص بنا متاحًا عبر الرابط: https://github.com/liutongkun/EdgRec.