HyperAIHyperAI
منذ 8 أيام

تمثيل نادر ذاتي التدريب للكشف عن الشذوذ في الفيديو

{Tyng-Luh Liu, Chiou-Shann Fuh, Ding-Jie Chen, He-Yen Hsieh*, Jhih-Ciang Wu*}
تمثيل نادر ذاتي التدريب للكشف عن الشذوذ في الفيديو
الملخص

كشف التسلسلات الفيديوية عن الشذوذ (VAD) يهدف إلى تحديد الأفعال أو النشاطات غير المتوقعة في تسلسل فيديو. تعتمد التقنيات الشائعة الحالية لـ VAD إما على صيغة الفئة الواحدة، التي تفترض أن جميع بيانات التدريب طبيعية، أو على التعلم الضعيف التوجيه، والذي يتطلب فقط تسميات على مستوى الفيديو (طبيعية/شاذة). ولإرساء منهج موحد لحل هذين النموذجين لـ VAD، نقدّم إطارًا ذاتي التدريب تمثيليًا نادرًا (S3R) يُمثّل مفهوم الشذوذ على مستوى الميزات من خلال استكشاف التآزر بين التمثيل القائم على القاموس والتعلم الذاتي التدريب. وباستخدام القاموس المُتعلّم، يُمكّن S3R وحدتين مترابطتين، هما en-Normal وde-Normal، من إعادة بناء ميزات المقاطع (snippets) وتصفية ميزات الأحداث الطبيعية. كما تتيح تقنيات التدريب الذاتي إنشاء عينات اصطناعية للحالات الطبيعية/الشاذة لتدريب كاشف الشذوذ. وقد أظهرنا من خلال تجارب واسعة أن S3R يحقق أداءً متميزًا جديدًا على مجموعات البيانات الشهيرة في مهام VAD من الفئة الواحدة والتعلم الضعيف التوجيه. يمكن الوصول إلى الكود الخاص بنا بشكل عام عبر الرابط: https://github.com/louisYen/S3R.

تمثيل نادر ذاتي التدريب للكشف عن الشذوذ في الفيديو | أحدث الأوراق البحثية | HyperAI