ReConPatch: التعلم المُشَابِه لتمثيلات اللوحة للكشف عن الشذوذ الصناعي

كشف الشذوذ يُعد أمرًا بالغ الأهمية في التعرف المتقدم على عيوب المنتجات، مثل الأجزاء الخاطئة، والمكونات غير المتماسكة، والأضرار في الإنتاج الصناعي. وبسبب ندرة حدوث العيوب وأنواعها غير المعروفة، يُعتبر كشف الشذوذ تحديًا كبيرًا في تعلم الآلة. ول superar هذا التحدي، اعتمدت الطرق الحديثة على التمثيلات البصرية الشائعة التي تم تدريبها مسبقًا على مجموعات بيانات الصور الطبيعية، وتم استخلاص السمات ذات الصلة من خلال عملية التجميع. ومع ذلك، لا تزال الطرق الحالية تعاني من فجوة بين السمات المدربة مسبقًا والبيانات المستهدفة، أو تتطلب تكبيرًا في المدخلات (input augmentation) الذي يجب تصميمه بعناية، خاصةً بالنسبة لمجموعات البيانات الصناعية. في هذه الورقة، نقدّم ReConPatch، التي تبني سمات تمييزية لكشف الشذوذ من خلال تدريب تحوّل خطي لسمات اللوحات (patch features) المستخرجة من النموذج المدرب مسبقًا. تعتمد ReConPatch على تعلّم التمثيل المقابل (contrastive representation learning) لجمع وتوزيع السمات بطريقة تُنتج تمثيلًا موجهًا للهدف وسهل الفصل. ولحل مشكلة عدم توفر أزواج مُعلَّمة لتعلم التمثيل المقابل، نستخدم قياسين لتشابه التمثيلات: التشابه الزوجي (pairwise similarity) والتشابه السياقي (contextual similarity) كتسميات وهمية (pseudo-labels). تحقق طريقةنا أفضل أداء مُسجَّل في كشف الشذوذ (99.72%) على مجموعة بيانات MVTec AD الشهيرة والصعبة. علاوة على ذلك، حققنا أفضل أداء مسجل في كشف الشذوذ (95.8%) على مجموعة بيانات BTAD.