اكتشاف الأحداث غير الطبيعية في الفيديو باستخدام مجموعات ضيقية للطبيعة الطبيعية

نقوم بصياغة مشكلة اكتشاف الأحداث الشاذة كمهمة للكشف عن القيم الشاذة ونقترح خوارزمية ذات مرحلتين تعتمد على تجميع k-means والماكينات المتجهة الداعمة من فئة واحدة (SVM) لاستبعاد القيم الشاذة. في مرحلة استخراج الخصائص، نقترح زيادة مكعبات الزمان والمكان بخصائص العرض العميقة المستخرجة من الطبقة التلافيفية الأخيرة لشبكة عصبية مسبقاً مدربة. بعد استخراج خصائص الحركة والعرض من الفيديو التدريبي الذي يحتوي فقط على أحداث طبيعية، نطبق تجميع k-means لاكتشاف التجمعات التي تمثل أنواعًا مختلفة من خصائص الحركة والعرض الطبيعية. في المرحلة الأولى، نعتبر أن التجمعات التي تحتوي على عدد أقل من العينات (بالنسبة لعتبة معينة) تحتوي بشكل أساسي على قيم شاذة، ونبعد هذه التجمعات بالكامل. في المرحلة الثانية، نقلل حدود التجمعات المتبقية بتدريب نموذج ماكينة متجهة داعمة من فئة واحدة (SVM) على كل تجمع. لاكتشاف الأحداث الشاذة في الفيديو الاختباري، نحلل كل عينة اختبارية ونأخذ بعين الاعتبار أعلى درجة طبيعية توفرها النماذج المدربة للماكينة المتجهة الداعمة من فئة واحدة (SVM)، بناءً على الفكرة bahwa يمكن أن تنتمي عينة الاختبار إلى تجمع واحد فقط من الطبيعية. إذا لم تناسب العينة الاختبارية بشكل جيد أي تجمع طبيعي ضيق، فإنه يتم تصنيفها كحدث غير طبيعي. نقارن طريقتنا مع عدة طرق متقدمة على ثلاثة مجموعات بيانات معيارية. تشير النتائج التجريبية إلى أن إطار عملنا لاكتشاف الأحداث الشاذة يمكنه تحقيق نتائج أفضل في معظم الحالات، بينما يقوم بمعالجة الفيديو الاختباري في الوقت الحقيقي بمعدل 24 إطاراً في الثانية على معالج واحد.