الكُتَّاب المُختَصّون بتمييز التماسك المُتَنَوِّع ذاتيًا فعّالون في كشف الشذوذ في الفيديو

نُقدّم نموذجًا فعّالًا للكشف عن الأحداث غير الطبيعية يستند إلى مشغل ترميز ذاتي مُخفّض الوزن (AE) يتم تطبيقه على مستوى الإطارات الفيديو. تكمن الإبداعية في النموذج المقترح في ثلاثة جوانب. أولاً، نُقدّم منهجية لوزن الرموز بناءً على مُدرجات الحركة، مما يُحوّل التركيز من المشهد الخلفي الثابت إلى الكائنات الأمامية. ثانيًا، نُدمج بين مشغل ترميز مُدرّس (teacher decoder) ومشغل ترميز تلميذ (student decoder) في هيكلنا، مستخدمين الفرق بين المخرجات الناتجة من كلا المشغلين لتحسين الكشف عن الأحداث غير الطبيعية. ثالثًا، نُنشئ أحداثًا غير طبيعية مُصطنعة لتعزيز مقاطع الفيديو التدريبية، ونُسند إلى نموذج الترميز الذاتي المُخفي مهمة إعادة بناء الإطارات الأصلية (بدون شذوذ) والخرائط المستوية للبُكسل المقابلة لشذوذات الحركة في آنٍ واحد. يؤدي هذا التصميم إلى نموذج فعّال وفعّال للغاية، كما يُثبت ذلك من خلال التجارب الواسعة التي أُجريت على أربع معايير: Avenue، ShanghaiTech، UBnormal، وUCSD Ped2. تُظهر النتائج التجريبية أن النموذج يحقق توازنًا ممتازًا بين السرعة والدقة، ويحقق درجات AUC تنافسية، مع معالجة تصل إلى 1655 إطارًا في الثانية. وبالتالي، فإن نموذجنا أسرع من الطرق المنافسة بين 8 و70 مرة. كما أجرينا دراسة تحليلية (ablation study) لتبرير التصميم المقترح. يُمكن الوصول إلى الكود الخاص بنا مجانًا عبر: https://github.com/ristea/aed-mae.