HyperAIHyperAI
منذ 17 أيام

إطار للكشف عن الشذوذ في الفيديو يستند إلى اتساق تمثيل السمات البصرية-الحركية

Xiangyu Huang, Caidan Zhao, Yilin Wang, Zhiqiang Wu
إطار للكشف عن الشذوذ في الفيديو يستند إلى اتساق تمثيل السمات البصرية-الحركية
الملخص

كشف الشذوذ في الفيديو يشير إلى تحديد الأحداث التي تخرج عن السلوك المتوقع. وبسبب نقص العينات الشاذة أثناء التدريب، يصبح كشف الشذوذ في الفيديو مهمةً صعبة للغاية. تلتزم معظم الطرق الحالية بنمط إعادة بناء أو تنبؤ بالإطارات المستقبلية. ومع ذلك، فإن هذه الطرق تتجاهل الاتساق بين معلومات المظهر والحركة في العينات، مما يحد من أداء كشف الشذوذ. فالأحداث الشاذة تحدث فقط في الجزء الأمامي المتحرك في مقاطع الفيديو المراقبة، وبالتالي يجب أن تكون المعاني المعبّر عنها من خلال تسلسلات الإطارات وتدفق الضوء (optical flow) دون معلومات الخلفية، في عملية كشف الشذوذ، متسقة للغاية وذات أهمية كبيرة. استنادًا إلى هذه الفكرة، نقترح إطارًا يُسمى تمثيل الاتساق في المعنى بين المظهر والحركة (AMSRC)، الذي يستخدم اتساق تمثيلات المعنى المظهرية والحركةية للبيانات الطبيعية لمعالجة كشف الشذوذ. أولاً، نصمم مُشفرًا ثنائي المسار لتمثيل معلومات المظهر والحركة للعينات الطبيعية، ونُدخل قيودًا لتعزيز الاتساق أكثر في معاني الميزات بين معلومات المظهر والحركة للعينات الطبيعية، بحيث يمكن التعرف على العينات الشاذة التي تتميز بتمثيل ميزات منخفض الاتساق بين المظهر والحركة. علاوةً على ذلك، يمكن استخدام انخفاض اتساق ميزات المظهر والحركة في العينات الشاذة لتكوين إطارات مُتنبأ بها ذات خطأ إعادة بناء أكبر، ما يجعل الكشف عن الشذوذ أسهل. وأظهرت النتائج التجريبية فعالية الطريقة المقترحة.