دراسة استكشافية للكشف عن الشذوذ في مقاطع الفيديو المتمحورة حول الإنسان باستخدام الترميز التبايني وتوقع المسارات

يُمثّل اكتشاف الشذوذ في الفيديو (VAD) مهمة بحثية صعبة وبارزة ضمن مجال رؤية الحاسوب. وفي السنوات الأخيرة، حظي اكتشاف الشذوذ في الفيديو القائم على الوضعيات (PAD) باهتمام كبير من المجتمع البحثي نظرًا لعدة مزايا جوهرية تتمتع بها هذه الطريقة مقارنة بالطرق القائمة على البكسلات، رغم الأداء غير المثالي أحيانًا. وبشكل خاص، يتميز PAD بتقليل التعقيد الحسابي، وحفظ الخصوصية بشكل فطري، وتخفيف المخاوف المتعلقة بالتمييز والتحيّز ضد مجموعات ديموغرافية معينة. يقدم هذا البحث TSGAD، وهو نموذج جديد للكشف عن الشذوذ يركز على الإنسان ويستند إلى تدفقين متزامنين ومُحسَّن بالرسوم البيانية مع استفادة من الترميز التبايني الذاتي (VAEs) والتوقع المساري. يهدف TSGAD إلى استكشاف إمكانية استخدام VAEs كنهج جديد للكشف عن الشذوذ في الفيديو القائم على الوضعيات والمركّز على الإنسان، بالإضافة إلى الاستفادة من مزايا التوقع المساري. نبيِّن فعالية TSGAD من خلال تجارب شاملة أجريت على مجموعات بيانات معيارية. أظهر TSGAD نتائجًا مشابهة للأساليب الأكثر تقدمًا، مما يبرز إمكانات تبني الترميز التبايني الذاتي. وهذا يشير إلى اتجاه واعد للجهود البحثية المستقبلية. يمكن الحصول على قاعدة الكود لهذه العمل من الرابط: https://github.com/TeCSAR-UNCC/TSGAD.