منذ 8 أشهر

الملخص

غالبًا ما تحتوي مقاطع الفيديو المحررة على تناقضات خفية بين إشاراتها البصرية والصوتية. نقترح طريقة في علم أصول الفيديو تعتمد على اكتشاف الشذوذ، والتي يمكنها تحديد هذه التناقضات ويمكن تدريبها باستخدام بيانات حقيقية غير مصنفة فقط. نقوم بتدريب نموذج ذاتي الانحدار لتوليد سلاسل من الخصائص السمعية-البصرية، باستخدام مجموعات من الخصائص التي تلتقط التزامن الزمني بين الإطارات المرئية والأصوات. أثناء الاختبار، نقوم بتسمية مقاطع الفيديو التي يُحَدِّد النموذج لها احتمالية منخفضة. رغم أن النموذج تم تدريبه بالكامل على مقاطع الفيديو الحقيقية، فقد حقق أداءً قويًا في مهمة اكتشاف مقاطع الفيديو المحررة للكلام.الموقع الرسمي للمشروع: https://cfeng16.github.io/audio-visual-forensics

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار