HyperAIHyperAI
منذ 8 أيام

كشف التسجيلات الفيديو عن الشذوذ باستخدام التدريب الضعيف مع تعلم قوي لشدة الميزة الزمنية

Yu Tian, Guansong Pang, Yuanhong Chen, Rajvinder Singh, Johan W. Verjans, Gustavo Carneiro
كشف التسجيلات الفيديو عن الشذوذ باستخدام التدريب الضعيف مع تعلم قوي لشدة الميزة الزمنية
الملخص

يُصاغ كشف الشذوذ باستخدام العلامات الضعيفة على مستوى الفيديو عادةً كمشكلة تعلّم متعددة المجموعات (MIL)، حيث نهدف إلى تحديد القطع التي تحتوي على أحداث شاذة، مع تمثيل كل فيديو كمجموعة من قطع الفيديو. وعلى الرغم من الأداء الفعّال الذي تُظهره الطرق الحالية في الكشف، فإن تمييزها للحالات الإيجابية، أي القطع النادرة الشاذة في الفيديوهات الشاذة، يتأثر بشكل كبير بالحالات السلبية السائدة، خاصة عندما تكون الأحداث الشاذة خفية وتمتاز بفروقات صغيرة مقارنة بالأنشطة الطبيعية. وتزداد هذه المشكلة سوءًا في العديد من الطرق التي تتجاهل الاعتماديات الزمنية المهمة في الفيديو. ولحل هذه المشكلة، نقدّم طريقة جديدة وذات أساس نظري قويّة تُسمّى تعلّم مقدار الخصائص الزمنية المقاومة (RTFM)، والتي تدرّب دالة لتعلّم مقدار الخصائص بهدف التعرف الفعّال على الحالات الإيجابية، مما يُحسّن بشكل كبير مقاومة نهج MIL تجاه الحالات السلبية من الفيديوهات الشاذة. كما تُعدّ RTFM بتكيف التحويلات المُتعدّدة (dilated convolutions) وآليات الانتباه الذاتي (self-attention) لالتقاط الاعتماديات الزمنية على المدى الطويل والقصير، بهدف تعلّم مقدار الخصائص بشكل أكثر دقة. أظهرت التجارب الواسعة أن نموذج MIL المدعوم بـ RTFM (1) يتفوّق بفارق كبير على عدة طرق حديثة متقدمة على أربع مجموعات بيانات معيارية (ShanghaiTech، UCF-Crime، XD-Violence، UCSD-Peds)، و(2) يحقق تحسينًا ملحوظًا في تمييز الشذوذ الخفي وكفاءة الاستخدام النموذجي. يُمكن الاطلاع على الكود عبر الرابط: https://github.com/tianyu0207/RTFM.

كشف التسجيلات الفيديو عن الشذوذ باستخدام التدريب الضعيف مع تعلم قوي لشدة الميزة الزمنية | أحدث الأوراق البحثية | HyperAI