HyperAIHyperAI

Command Palette

Search for a command to run...

هل تقصد حقًا ذلك؟ مجموعة بيانات عميقة مزيفة متعددة الوسائط تعتمد على المحتوى وطريقة متعددة الوسائط لتحديد المكان الزمني للتزوير

Zhixi Cai Kalin Stefanov Abhinav Dhall Munawar Hayat

الملخص

نظرًا لأثرها الاجتماعي الكبير، أصبح اكتشاف التزييف العميق (Deepfake) محط اهتمام متزايد في مجتمع رؤية الحاسوب. تعتمد معظم طرق اكتشاف التزييف العميق على الهوية، والسمات الوجهية، والتغيرات المكانية-الزمنية المستندة إلى الاضطرابات العدائية في كامل الفيديو أو في مواقع عشوائية، مع الحفاظ على معنى المحتوى دون تغيير. ومع ذلك، قد يحتوي التزييف العميق المتقدم على جزء صغير فقط من التلاعب في الفيديو أو الصوت، مما يسمح بتغيير جذري في معنى المحتوى، مثل عكس الاتجاه العاطفي بالكامل. نقدم مجموعة بيانات صوتية-بصرية للتحريفات المُزيفة (LAV-DF) مُصممة بذكاء لدعم مهمة تعلم تحديد مواقع التزييف الزمنية. وبشكل خاص، تُجرى التلاعبات الصوتية-البصرية الموجهة بالمضمون بشكل استراتيجي لتغيير اتجاه المشاعر في الفيديو ككل. كما نقدّم طريقة أساسية للقياس (baseline) لمجموعة البيانات المقترحة، وهي نموذج 3DCNN يُسمى اكتشاف التزييف الزمني الواعي بالحدود (BA-TFD)، والذي يُوجّه باستخدام دوال خسارة تشمل الخسارة التمييزية، وتناسق الحدود، وتصنيف الإطارات. تُظهر التحليلات الكمية والكيفية الواسعة أداءً قويًا للطريقة المقترحة في مهام تحديد مواقع التزييف الزمنية واكتشاف التزييفات المُزيفة.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp