HyperAIHyperAI
منذ 17 أيام

كشف الانحراف البصري باستخدام محول الانتباه المزدوج والتدفق التمييزي

Haiming Yao, Wei Luo, Wenyong Yu
كشف الانحراف البصري باستخدام محول الانتباه المزدوج والتدفق التمييزي
الملخص

في هذه الورقة، نقدّم إطار العمل الجديد المتطور من نوع Dual-attention Transformer وDiscriminative Flow (DADF) للكشف عن الشذوذ البصري. يُعد الكشف عن الشذوذ البصري بناءً على معرفة طبيعية فقط مجالًا ذا تطبيقات واسعة في السياقات الصناعية، وقد لاقت هذه المنهجية اهتمامًا كبيرًا. ومع ذلك، تفشل معظم الطرق الحالية في تلبية المتطلبات المطلوبة. في المقابل، يقدّم الإطار المُقترح DTDF نموذجًا جديدًا: فهو يعتمد أولاً على شبكة مُدرّبة مسبقًا للحصول على تمثيلات سابقة متعددة المقاييس، ثم يُطوّر نموذجًا يعتمد على Transformer بصري يحتوي على آليتين للاهتمام المزدوج، وهما الاهتمام الذاتي والاهتمام التذكاري، لتحقيق إعادة بناء على مستويين للتمثيلات السابقة، مع مراعاة التسلسل والاتساق الطبيعي. علاوةً على ذلك، نقترح استخدام تدفقات التطبيع (normalizing flow) لبناء دالة احتمالية تمييزية للترابط المشترك بين التمثيلات السابقة وإعادة البناء في كل مقياس. وقد حقق إطار DADF نتائج تصل إلى 98.3/98.4 في مقياس AUROC على مستوى الصورة/البكسل في مجموعة بيانات Mvtec AD؛ و83.7 في مقياس AUROC على مستوى الصورة و67.4 في مقياس sPRO على مستوى البكسل في مجموعة بيانات Mvtec LOCO AD، مما يُظهر فعالية النهج المُقترح.

كشف الانحراف البصري باستخدام محول الانتباه المزدوج والتدفق التمييزي | أحدث الأوراق البحثية | HyperAI