HyperAIHyperAI

Command Palette

Search for a command to run...

Console

اختبار الواقع المرئي: هل يمكن لفيديوهات ASMR المُولَّدة بالذكاء الاصطناعي خداع نماذج التصور البصري والبشر؟

Jiaqi Wang Weijia Wu Yi Zhan Rui Zhao Ming Hu James Cheng Wei Liu Philip Torr Kevin Qinghong Lin

Abstract

أحرزت التطورات الحديثة في توليد الفيديو تقدماً ملحوظاً، حيث أصبحت المحتويات الناتجة واقعية إلى درجة تجعلها في كثير من الأحيان لا تُميَّز عن الفيديوهات الحقيقية، ما جعل كشف الفيديوهات المُولَّدة بالذكاء الاصطناعي تحدياً اجتماعياً ناشئاً. وغالباً ما تقيّم المعايير السابقة للكشف عن محتوى الذكاء الاصطناعي (AIGC) الفيديوهات دون صوت، وتستهدف مجالات سردية واسعة، وتركز على التصنيف فقط. لكن ما يزال غير واضح ما إذا كانت نماذج توليد الفيديو المتطورة حالياً قادرة على إنتاج فيديوهات غامرة مزامنة مع الصوت، تُضلل البشر والأنظمة البصرية-الصوتية المُتعددة (VLMs) بشكل موثوق. وللإجابة على هذا السؤال، نقدّم "اختبار واقعية الفيديو" (Video Reality Test)، وهو مجموعة معايير (benchmark) مبنية على مصادر ASMR لاختبار الواقعية الإدراكية في ظل تزامن صوتي-بصري مكثف، وتمتاز بالمساحات التالية: (1) مصادر فيديو-صوت ASMR غامرة. تم بناء المعيار على فيديوهات ASMR حقيقية تم اختيارها بعناية، ويهدف إلى تفاعلات دقيقة بين الأفعال والأجسام، مع تنوع كبير في الأدوات، والإجراءات، والخلفيات. (2) تقييم مبني على مراجعة من الأقران. يعتمد على بروتوكول مُضاد (Adversarial) يُشَكِّل فيه نماذج توليد الفيديو كمُبدِعين يسعون إلى خداع المُراجعين، بينما تؤدي نماذج VLM دور المُراجعين الذين يسعون للكشف عن التزييف. تُظهر النتائج التجريبية ما يلي: نجح أفضل مُبدع (Veo3.1-Fast) في خداع معظم نماذج VLM، حيث حقق أقوى مُراجع (Gemini 2.5-Pro) دقة وصلت إلى 56% فقط (العشوائية 50%)، وهو ما يبقيه بعيداً عن أداء الخبراء البشريين (81.25%). ورغم أن إضافة الصوت يُحسّن القدرة على التمييز بين المُزيف والواقعي، إلا أن المؤشرات السطحية مثل العلامات المائية لا تزال قادرة على إرباك النماذج بشكل كبير. تُحدِّد هذه النتائج الحدود الحالية لواقعية توليد الفيديو، وتكشف عن قيود نماذج VLM في القدرة على الحفاظ على الاتساق الإدراكي والاتساق الصوتي-البصري. يُمكن الاطلاع على الكود الخاص بنا عبر الرابط: https://github.com/video-reality-test/video-reality-test.


Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
اختبار الواقع المرئي: هل يمكن لفيديوهات ASMR المُولَّدة بالذكاء الاصطناعي خداع نماذج التصور البصري والبشر؟ | Papers | HyperAI