UGC-VQA: تقييم معياري لتقييم جودة الفيديو العمومي للوسائط المُنشأة من قبل المستخدمين

شهدت السنوات الأخيرة انفجارًا في محتوى الفيديو الذي يُنشئه المستخدمون (UGC)، والذي يتم مشاركته وبثه عبر الإنترنت، وذلك بفضل تطور الأجهزة الاستهلاكية المعقولة والموثوقة لالتقاط الفيديو، بالإضافة إلى الشعبية الهائلة لمنصات وسائل التواصل الاجتماعي. ونتيجة لذلك، هناك حاجة كبيرة إلى نماذج دقيقة لتقييم جودة الفيديو (VQA) الخاصة بفيديوهات UGC/الاستهلاكية، لرصد ومراقبة وتحسين هذا المحتوى الضخم. يُعد تقييم الجودة دون معرفة النموذج الأصلي (العمليات البصرية في البيئة الطبيعية) أمرًا بالغ الصعوبة، نظرًا لأن تدهور جودة محتوى UGC يكون غير متوقع ومعقدًا غالبًا، وغالبًا ما يكون مختلطًا. في هذا العمل، نسهم في تطوير مسألة VQA الخاصة بفيديوهات UGC من خلال إجراء تقييم شامل للميزات والأنماط الرائدة في تقييم جودة الفيديو بدون مرجع (BVQA) ضمن هيكل تقييم ثابت، مما يُحدث رؤى تجريبية جديدة حول الدراسات الموضوعية لجودة الفيديو وتصميم نماذج VQA. وباستخدام استراتيجية اختيار الميزات فوق الميزات الرائدة في نماذج VQA، نتمكن من استخلاص 60 ميزة إحصائية من أصل 763 ميزة تُستخدم في النماذج الرائدة، لإنشاء نموذج جديد مبني على الدمج يُدعى \textbf{VID}eo quality \textbf{EVAL}uator (VIDEVAL)، والذي يوازن بشكل فعّال بين الأداء والكفاءة في تقييم جودة الفيديو. تُظهر نتائج تجاربنا أن VIDEVAL تحقق أداءً من الدرجة الأولى (state-of-the-art) بتكلفة حسابية أقل بكثير مقارنةً بالنماذج الرائدة الأخرى. كما أن بروتوكول دراستنا يُعرّف معيارًا موثوقًا لمشكلة VQA الخاصة بفيديوهات UGC، والذي نعتقد أنه سيُسهّل الأبحاث المستقبلية في مجال نمذجة VQA القائمة على التعلم العميق، وكذلك في مجالات معالجة الفيديو الاستهلاكي الفعالة المُحسّنة من منظور إدراكي، وتحويله (transcoding)، وبثه. ولتعزيز الأبحاث القابلة للتكرار والتقييم العام، تم إتاحة تنفيذ VIDEVAL عبر الإنترنت: \url{https://github.com/tu184044109/VIDEVAL_release}.