HyperAIHyperAI

Command Palette

Search for a command to run...

التناسق الصوتي مهم: كاشف تزييف متعدد الوسائط جديد

Hsin-Min Wang Yu Tsao Yan-Tsung Peng Sarwar Khan Ammarah Hashmi Sahibzada Adil Shahzad

الملخص

تطورت تقنية الدّيبي فِيك (Deepfake) بشكل كبير، لكنها تمثل سيفًا ذا حدين بالنسبة للمجتمع. يمكن استخدامها لأغراض مفيدة، مثل استعادة المحتوى القديم في الأفلام ذات الجودة المنخفضة، أو لأغراض ضارة، مثل إنشاء لقطات مزيفة بهدف التلاعب بالرأي العام أو نشر محتوى جنسي غير مصرح به. وتم بذل الكثير من الجهود لمحاربة الاستخدام غير المشروع لهذه التقنية من خلال كشف اللقطات المزيفة، وذلك بفضل توفر مجموعات بيانات عامة واسعة النطاق، بالإضافة إلى النماذج القائمة على التعلم العميق أحادي الوضع (unimodal). ومع ذلك، تظل هذه الأساليب غير كافية في كشف التلاعب متعدد الأوضاع، مثل التلاعب في الصور والصوت معًا. تقدم هذه الدراسة طريقة جديدة للكشف عن الدّيبي فِيك متعدد الأوضاع تعتمد على تقنية قراءة الشفتين (lip-reading)، وتحظى باسم "Lip Sync Matters" (التناسق الصوتي الشفوي مهم). وتستهدف هذه الطريقة الخصائص الدلالية عالية المستوى، لاستغلال عدم التوافق بين تسلسل الشفتين المستخرج من الفيديو، والتسلسل الاصطناعي للشفتين المُنتَج من الصوت باستخدام نموذج Wav2lip، بهدف اكتشاف مقاطع الفيديو المزيفة. وأظهرت النتائج التجريبية أن الطريقة المقترحة تتفوق على عدة طرق حالية، سواء كانت أحادية الوضع أو مجمعة أو متعددة الأوضاع، على مجموعة بيانات FakeAVCeleb متعددة الأوضاع المتوفرة علنًا.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
التناسق الصوتي مهم: كاشف تزييف متعدد الوسائط جديد | مستندات | HyperAI