APRIL-GAN: طريقة تصنيف وتقسيم الشذوذ صفرية/قليلة العينات لتحديات مسابقة VAND في CVPR 2023، المسارين 1 و2: المركز الأول في الكشف عن الشذوذ صفرية العينات والمركز الرابع في الكشف عن الشذوذ قليلة العينات

في هذا التقرير التقني، نقدم موجزًا لحلنا الخاص ضمن مسار "الصفر/قليل التدريب" في تحدي الكشف البصري عن الشذوذ والجديد (VAND) 2023. بالنسبة للفحص البصري الصناعي، فإن بناء نموذج واحد يمكنه التكيف السريع مع عدد كبير من الفئات دون الحاجة إلى صور مرجعية طبيعية أو مع وجود عدد قليل جدًا منها، يُعد اتجاهًا بحثيًا واعدًا. ويُعزى ذلك بشكل رئيسي إلى التنوع الكبير في أنواع المنتجات. وبالنسبة لمسار الصفر التدريب، نقترح حلًا يعتمد على نموذج CLIP، مع إضافة طبقات خطية إضافية. وتُستخدم هذه الطبقات لتحويل ميزات الصور إلى فضاء التضمين المشترك، بحيث يمكن مقارنتها بمواصفات النص لتكوين خرائط الشذوذ. علاوة على ذلك، عند توفر صور مرجعية، نستخدم عدة بنوك ذاكرة لتخزين ميزاتها، ونقارنها بميزات صور الاختبار خلال مرحلة الاختبار. وفي هذا التحدي، حقق حلنا المركز الأول في مسار الصفر التدريب، وتميز بشكل لافت في التجزئة، حيث سجل تحسنًا ملحوظًا في درجة F1 بلغت 0.0489 مقارنة بالمشارك الثاني. كما حصلنا في مسار قليل التدريب على المركز الرابع إجمالاً، مع تصدرنا لجميع الفرق المشاركة في درجة F1 التصنيف بقيمة 0.8687.