التعلم الذاتي القائم على الاتساق لتحديد المواقع الزمنية للانحرافات

تتناول هذه الدراسة الكشف عن الشذوذ المُراقب ضعيفًا، حيث يُسمح للنموذج التنبؤي بالتعلُّم ليس فقط من أمثلة طبيعية، بل أيضًا من عدد قليل من الشذوذ المُعلَّمة التي تُقدَّم أثناء التدريب. وبشكل خاص، نتناول تحديد مواقع الأنشطة الشاذة داخل تدفق الفيديو: وهو سيناريو يُعدّ أمرًا صعبًا جدًا، نظرًا لأن أمثلة التدريب تُزوَّد فقط بتعليقات على مستوى الفيديو (وليس على مستوى الإطارات). وقد اقترح العديد من الدراسات الحديثة مصادر ت régularization مختلفة للتعامل مع هذه المشكلة، وذلك من خلال فرض قيود على الندرة والانسيابية على مScores الشذوذ المُتعلَّمة على مستوى الإطارات. في هذه الدراسة، نستلهم من التطورات الحديثة في مجال التعلم ذاتي التوجيه، ونطلب من النموذج أن يُنتج نفس القيم للإطارات المختلفة المُستمدة من نفس تسلسل فيديو. ونُظهر أن فرض هذا التوافق (التماثل) يُحسّن أداء النموذج على مجموعة بيانات XD-Violence.