STemGAN: شبكة توليدية متنافسة فضائية-زمنية للكشف عن الشذوذ في الفيديو
أصبح الكشف التلقائي وتفسير الأحداث غير الطبيعية مهامًا حاسمة في أنظمة المراقبة بالفيديو على نطاق واسع. وتُعزى التحديات إلى غياب تعريف واضح للطبيعة غير الطبيعية، مما يحد من استخدام الأساليب المُشرَّفة. ولحل هذه المشكلة، نقترح طريقة جديدة للكشف غير المُشرَّف عن الشذوذ تُدعى الشبكة التوليدية التنافسية الفضائية-الزمنية (STemGAN). يتكون هذا الإطار من مُولِّد ومُميِّز يتعلمان من السياق المرئي، مستخدمين المعلومات الفضائية والزمنية معًا للتنبؤ بالإطارات المستقبلية. يعتمد المُولِّد على هيكلية المُشفِّر التلقائي (AE)، ويحتوي على مُشفِّر ثنائي التدفق لاستخراج معلومات المظهر والحركة، بينما يحتوي المُفكِّك على وحدة انتباه القناة (CA) لتركيز الانتباه على الميزات الديناميكية للخلفية الأمامية. علاوةً على ذلك، نقدِّم طريقة للتعلم القابل للانتقال (Transfer Learning) تُعزز من قابلية تعميم STemGAN. وقد استخدمنا مجموعات بيانات معيارية للكشف عن الشذوذ (AD) للمقارنة بين أداء منهجنا وأفضل الطرق الحالية باستخدام مقاييس تقييم قياسية، مثل AUC (مساحة تحت المنحنى) وEER (معدل الخطأ المتساوي). أظهرت النتائج التجريبية أن STemGAN المقترح يتفوق على الطرق الحالية المتميزة، محقِّقًا درجة AUC بلغت 97.5% على مجموعة UCSDPed2، و86.0% على CUHK Avenue، و90.4% على Subway-entrance، و95.2% على Subway-exit.