HyperAIHyperAI
منذ 3 أشهر

كتلة تحويلية مُقنعة ذات تدريب ذاتي مُقنّعة للكشف عن الشذوذ

Neelu Madan, Nicolae-Catalin Ristea, Radu Tudor Ionescu, Kamal Nasrollahi, Fahad Shahbaz Khan, Thomas B. Moeslund, Mubarak Shah
كتلة تحويلية مُقنعة ذات تدريب ذاتي مُقنّعة للكشف عن الشذوذ
الملخص

لقد اكتسب كشف الشذوذ اهتمامًا متزايدًا في مجال الرؤية الحاسوبية مؤخرًا، على الأرجح بسبب تطبيقاته الواسعة التي تمتد من كشف العيوب في المنتجات على خطوط الإنتاج الصناعية وتحديد الأحداث القادمة في أنظمة المراقبة عبر الفيديو إلى اكتشاف الآفات في التصوير الطبي. بغض النظر عن المجال، يُصاغ كشف الشذوذ عادةً كمهمة تصنيف من فئة واحدة، حيث يتم التعلم فقط على أمثلة طبيعية. تُبنى عائلة كاملة من طرق كشف الشذوذ الناجحة على التعلم لإعادة بناء المدخلات الطبيعية التي تم إخفاؤها (مثل القطع، الإطارات المستقبلية، إلخ)، مع استخدام حجم خطأ إعادة البناء كمؤشر لمستوى الشذوذ. على عكس الطرق الأخرى القائمة على إعادة البناء، نقدم بلوكًا ذاتي التدريب مُقنَّعًا مُعتمدًا على التحويلات التلافيفية (SSMCTB) جديدًا، يُدمج الوظيفة القائمة على إعادة البناء في المستوى المعماري الأساسي. يتميز البلوك المقترح بقدرته العالية على المرونة، مما يسمح بإخفاء المعلومات في أي طبقة من الشبكة العصبية، كما يتوافق مع طيف واسع من الهياكل العصبية. في هذه الدراسة، نوسع بلوكنا السابق ذاتي التدريب القائم على التنبؤ بالتحفيز التلافيفي (SSPCAB) بإضافة طبقة تلافيفية ثلاثية الأبعاد مُقنَّعة، ومحفز تحويلات (Transformer) للانتباه عبر القنوات، بالإضافة إلى هدف ذاتي التدريب الجديد المستند إلى دالة هوبير (Huber loss). علاوة على ذلك، نُظهر أن بلوكنا قابل للتطبيق في طيف أوسع من المهام، حيث نضيف كشف الشذوذ في الصور الطبية ومقاطع الفيديو الحرارية إلى المهام السابقة التي كانت تعتمد على الصور الملونة (RGB) ومقاطع الفيديو المراقبة. نُظهر عامة ومرنّة بلوك SSMCTB من خلال دمجه في عدة نماذج عصبية حديثة ومتطورة لكشف الشذوذ، مما يُسفر عن نتائج تجريبية تؤكد تحسينًا كبيرًا في الأداء على خمسة معايير معيارية. نُطلق كودنا وبياناتنا كمصدر مفتوح على الرابط التالي: https://github.com/ristea/ssmctb.