تعلم النمطية في مسارات الهيكل العظمي لاكتشاف الشذوذ في الفيديوهات

تم استخدام خصائص المظهر على نطاق واسع في اكتشاف الشذوذ في الفيديو، رغم أنها تحتوي على عوامل معقدة متداخلة. نقترح طريقة جديدة لنمذجة الأنماط الطبيعية لحركات الإنسان في مقاطع الفيديو الرقابية لاكتشاف الشذوذ باستخدام خصائص الهيكل العظمي الديناميكي. نقوم بتفكيك حركات الهيكل العظمي إلى مكونين فرعيين: الحركة الجسدية العامة والوضعية الجسدية المحلية. نمذجنا الديناميكيات والتفاعل بين الخصائص المتصلة في شبكتنا التكرارية الجديدة ذات المُرسِل والمُستقبِل (Message-Passing Encoder-Decoder Recurrent Network). لاحظنا أن الخصائص المنفصلة تتفاعل بشكل تعاوني في نموذجنا الزماني-المكاني لتحديد الأحداث غير المنتظمة المتعلقة بالإنسان بدقة من سلاسل مقاطع الفيديو الرقابية. مقارنةً بالنماذج التقليدية القائمة على المظهر، يحقق أسلوبنا أداءً أفضل في اكتشاف القيم الشاذة. كما أن نموذجنا يوفر فحصًا "مفتوح الصندوق" وتفسير القرارات بفضل الخصائص التي يمكن فهمها دلالياً والهندسة المعمارية للشبكة التي تدعم التفسير.