اكتشاف الشذوذ في الفيديو بشكل ضعيف الإشراف باستخدام BatchNorm

في مجال اكتشاف الشذوذ في الفيديو تحت الإشراف الضعيف (WVAD)، حيث تكون التسميات على مستوى الفيديو فقط متاحة لتشير إلى وجود أو عدم وجود أحداث غير طبيعية، ينشأ التحدي الرئيسي من الغموض الداخلي في التوقيت الزمني للشذوذ. مستوحىً من البصيرة الإحصائية التي تشير إلى أن الخصائص الزمنية للأحداث الشاذة غالباً ما تظهر كقيم شاذة، نقترح طريقة جديدة تُعرف بـ BN-WVAD، والتي تقوم بتضمين تقنية BatchNorm في WVAD. في الطريقة المقترحة BN-WVAD، نستفيد من انحراف الميزة عن متجه الوسط (DFM) لتقنية BatchNorm كمعيار موثوق به لاكتشاف الأجزاء المحتملة غير الطبيعية في الفيديوهات الشاذة. يعتبر المعيار DFM المقترح أيضاً تمييزياً للاعتراف بالشذوذ وأكثر مقاومة للضوضاء في التسميات، مما يجعله نقطة تقييم إضافية للشذوذ لتعديل توقعات تصنيف الشذوذ الذي يكون عرضة للضوضاء في التسميات. بالإضافة إلى ذلك، تم تصميم استراتيجية اختيار على مستوى الدفعة لتصفية المزيد من الأجزاء الشاذة في الفيديوهات التي تتضمن المزيد من الأحداث الشاذة. أثبت النموذج المقترح BN-WVAD أداءً فائقًا على مجموعة بيانات UCF-Crime بمعدل AUC بلغ 87.24٪، وعلى مجموعة بيانات XD-Violence حيث وصل AP إلى 84.93٪. يمكن الوصول إلى تنفيذ الكود الخاص بنا عبر الرابط:https://github.com/cool-xuan/BN-WVAD.الترجمة للمصطلحات التقنية:- Weakly supervised video anomaly detection (WVAD): اكتشاف الشذوذ في الفيديو تحت الإشراف الضعيف (WVAD)- Temporal annotations: التوقيت الزمني- BatchNorm: تقنية BatchNorm- Divergence of Feature from Mean vector (DFM): انحراف الميزة عن متجه الوسط (DFM)- Anomaly classifier: تصنيف الشذوذ- Label noise: الضوضاء في التسميات- AUC: معدل AUC- AP: معدل AP