نحو تسمية بكسل فعالة للكشف عن الأخطاء والتحديد المكاني في الصناعة

في مجال مهام الكشف عن الشذوذ (Anomaly Detection - AD) العملية، يثبت تسمية البكسلات الشاذة يدويًا أنها عملية باهظة الثمن. ولذلك، يتم تصميم العديد من طرق AD كتصنيفات أحادية الفئة، مخصصة لمجموعات تدريب خالية تمامًا من الشذوذ، مما يضمن نهجًا أكثر كفاءة من الناحية التكلفة. رغم أن بعض الأعمال الرائدة قد أظهرت زيادة في دقة AD من خلال دمج عينات شاذة حقيقية في التدريب، إلا أن هذه الزيادة تأتي على حساب عمليات تسمية مكثفة تتطلب الكثير من الجهد. يقدم هذا البحث توازنًا بين دقة AD وتكلفة التسمية من خلال تقديم ADClick، وهو خوارزمية جديدة للتقسيم التفاعلي للصورة (Interactive Image Segmentation - IIS). يعمل ADClick بكفاءة على إنشاء أقنعة شاذة "حقيقية" (ground-truth) لصور معيبة حقيقية، مستفيدًا من الخصائص الباقية المبتكرة والتنبيهات اللغوية المعدة بدقة. ومن الجدير بالذكر أن ADClick يظهر قدرة تعميم أعلى بكثير مقارنة بأساليب IIS المتقدمة الحالية. يعمل ADClick كأداة لتسمية الشذوذ، حيث يولد تسميات شاذة عالية الجودة (AP = 94.1٪ على MVTec AD) بناءً على 3 إلى 5 نقرات يدوية فقط لكل صورة تدريب. بالإضافة إلى ذلك، نوسع قدرات ADClick لتشمل نموذج ADClick-Seg المحسن والمصمم للكشف عن الشذوذ وتوضيح موقعها. من خلال ضبط نموذج ADClick-Seg باستخدام التسميات الضعيفة التي يستنتجها ADClick، نحدد أفضل الأداء في مهام الكشف عن الشذوذ تحت الإشراف (AP = 86.4٪ على MVTec AD و AP = 78.4٪، PRO = 98.6٪ على KSDD2).