نموذج تشتت التنبؤ بالسمات للكشف عن الشذوذ في الفيديو

كشف الانحرافات في الفيديو يُعد مجالًا بحثيًا مهمًا ومهامًا صعبة في التطبيقات الواقعية. نظرًا لعدم توفر أحداث انحراف مُANNOTATED على نطاق واسع، تركز معظم الطرق الحالية لكشف الانحرافات في الفيديو (VAD) على تعلم توزيع العينات الطبيعية للكشف عن العينات التي تختلف بشكل كبير عن هذا التوزيع باعتبارها انحرافات. ولتحسين تعلم توزيع الحركة والشكل الطبيعي، تُستخدم العديد من الشبكات المساعدة لاستخراج معلومات الكائن الأمامي أو الحركات. تُعد هذه السمات عالية المستوى فعالة في تصفية الضوضاء الناتجة عن الخلفية وتقليل تأثيرها على نماذج الكشف. ومع ذلك، فإن أداء هذه النماذج الإضافية ذات السمات العالية يُؤثر بشكل كبير على أداء طرق VAD. مستوحى من القدرة المُبهرة للنماذج التوليدية والمقاومة للضوضاء التي تمتلكها النماذج التوسعية (DM)، نقدم في هذا العمل طريقة جديدة تعتمد على النموذج التوسيعي للتنبؤ بسمات إطارات الفيديو للكشف عن الانحرافات. نهدف إلى تعلم توزيع العينات الطبيعية دون الحاجة إلى أي نماذج إضافية لاستخراج السمات عالية المستوى. لتحقيق ذلك، نبني وحدتين للنماذج التوسعية المضادة للضوضاء لتنبؤ السمات وتحسينها. تركز الوحدة الأولى على تعلم حركة السمات، بينما تركز الوحدة الثانية على تعلم شكل السمات. إلى حد معرفتنا، فإن هذه هي المرة الأولى التي تُستخدم فيها طريقة قائمة على النموذج التوسيعي للتنبؤ بسمات الإطارات في مجال كشف الانحرافات في الفيديو. كما تتيح القدرة القوية للنماذج التوسعية لطريقتنا التنبؤ بدقة أكبر بالسمات الطبيعية مقارنةً بالطرق القائمة على التنبؤ بالسمات دون استخدام النماذج التوسعية. تُظهر التجارب الواسعة أن النهج المقترح يتفوق بشكل كبير على أحدث الطرق المُنافسة.