منذ 2 أشهر
forensics الفيديو ذاتي الإشراف من خلال الكشف عن الشذوذ السمعي البصري
Chao Feng; Ziyang Chen; Andrew Owens

الملخص
غالبًا ما تحتوي مقاطع الفيديو المحررة على تناقضات خفية بين إشاراتها البصرية والصوتية. نقترح طريقة في علم أصول الفيديو تعتمد على اكتشاف الشذوذ، والتي يمكنها تحديد هذه التناقضات ويمكن تدريبها باستخدام بيانات حقيقية غير مصنفة فقط. نقوم بتدريب نموذج ذاتي الانحدار لتوليد سلاسل من الخصائص السمعية-البصرية، باستخدام مجموعات من الخصائص التي تلتقط التزامن الزمني بين الإطارات المرئية والأصوات. أثناء الاختبار، نقوم بتسمية مقاطع الفيديو التي يُحَدِّد النموذج لها احتمالية منخفضة. رغم أن النموذج تم تدريبه بالكامل على مقاطع الفيديو الحقيقية، فقد حقق أداءً قويًا في مهمة اكتشاف مقاطع الفيديو المحررة للكلام.الموقع الرسمي للمشروع: https://cfeng16.github.io/audio-visual-forensics