HyperAIHyperAI
منذ 11 أيام

رابيك: تنبؤ سريع ودقيق بجودة الفيديو للمحتوى الذي يُنشئه المستخدمون

Zhengzhong Tu, Xiangxu Yu, Yilin Wang, Neil Birkbeck, Balu Adsumilli, Alan C. Bovik
رابيك: تنبؤ سريع ودقيق بجودة الفيديو للمحتوى الذي يُنشئه المستخدمون
الملخص

أصبح تقييم جودة الفيديو بدون رؤية أو بدون مرجع (Blind or no-reference) للمحتوى الذي ينشئه المستخدمون (UGC) مشكلة مُتَّبَعة وصعبة، لم تُحل بعد. وبالتالي، هناك حاجة ماسة إلى نماذج مُقدِّرة لجودة الفيديو دقيقة وفعالة، تتناسب مع هذا النوع من المحتوى، لتحقيق تحليل ومعالجة أكثر ذكاءً لفيديوهات UGC. أظهرت الدراسات السابقة أن إحصائيات المشهد الطبيعي وسمات التعلم العميق كافيتان لالتقاط التشوهات المكانية، التي تمثل جانبًا مهمًا من مشكلات جودة فيديوهات UGC. ومع ذلك، تُظهر هذه النماذج في التطبيقات العملية إما عدم القدرة على التنبؤ بدقة، أو كفاءة منخفضة عند التعامل مع الفيديوهات المعقدة والمتعددة التنوع في محتوى UGC. في هذا العمل، نقدّم نموذجًا فعّالًا وسريعًا لتقييم جودة الفيديو الخاص بمحتوى UGC، نسميه "مُقيِّم جودة الفيديو السريع والدقيق" (RAPIQUE)، والذي نُظهر أنه يُنافس نماذج الحد الأقصى من الأداء (SOTA) من حيث الدقة، لكنه يمتلك زمن تشغيل أسرع بمرات عديدة. يدمج RAPIQUE ومُستفيدًا من مزايا كل من ميزات إحصائيات المشهد المُتَحَسِّسَة للجودة وسمات الشبكة العميقة المُتَحَسِّسَة للدلالات، ما يمكّننا من تصميم أول نموذج عام وفعّال لإحصائيات النطاق الممرّ (bandpass) المكانية والزمنية (الزمنية-المكانية) لنمذجة جودة الفيديو. تُظهر نتائج تجاربنا على قواعد بيانات حديثة وضخمة لجودة فيديوهات UGC أن RAPIQUE يُحقق أفضل الأداء في جميع المجموعات، وبتكلفة حوسبة أقل بشكل ملحوظ. نأمل أن يُحفّز هذا العمل جهودًا إضافية في اتجاه نمذجة جودة الفيديو بشكل عملي، من أجل تطبيقات محتملة في الوقت الفعلي وبنواتج تأخير منخفضة. ولتعزيز الاستخدام العام، تم إتاحة نسخة قابلة للتنزيل من RAPIQUE مجانًا عبر الإنترنت: \url{https://github.com/vztu/RAPIQUE}.

رابيك: تنبؤ سريع ودقيق بجودة الفيديو للمحتوى الذي يُنشئه المستخدمون | أحدث الأوراق البحثية | HyperAI