تقييم جودة الفيديو بسرعة إطارات عالية باستخدام VMAF والاختلافات الإنتروبيّة

أدى ازدياد شعبية مقاطع الفيديو التي تُبث مباشرةً وتحتوي على محتوى سريع الحركة إلى ازدياد الاهتمام بفيديوهات معدل الإطارات العالي (HFR). في هذا العمل، نتناول مشكلة تقييم جودة الفيديو المعتمدة على معدل الإطارات (VQA) عندما تكون مقاطع الفيديو التي يتم مقارنتها مختلفة في معدل الإطارات والمعامل التكميلي (compression factor). تعتمد النماذج الحالية لتقييم جودة الفيديو، مثل نموذج VMAF، على ارتباط قوي بالتقديرات البصرية عندما تكون مقاطع الفيديو المُقارنة بنفس معدل الإطارات وتحتوي على تشوهات تقليدية مثل التكميل، التحجيم، وغيرها. ومع ذلك، يتطلب هذا الإطار إجراء خطوة ما قبل المعالجة إضافية عند مقارنة مقاطع الفيديو ذات معدلات إطارات مختلفة، مما قد يحد من أدائه العام. في الآونة الأخيرة، تم اقتراح نموذج VQA المعروف بـ "الفرق الإنتروبي العام" (GREED) لمعالجة التشوهات الناتجة عن تغير معدل الإطارات، وأظهر أداءً متفوقًا على قاعدة بيانات LIVE-YT-HFR التي تحتوي على تشوهات تعتمد على معدل الإطارات مثل "الاهتزاز" (judder) و"الوميض" (strobing) وغيرها. في هذه الورقة، نقترح توسيعًا بسيطًا يتم فيه دمج الميزات المستمدة من نموذج VMAF ونموذج GREED بهدف الاستفادة من مزايا كلا النموذجين معًا. ونُظهر من خلال تجارب متعددة أن إطار العمل المُقترَح للدمج يؤدي إلى ميزات أكثر كفاءة في التنبؤ بجودة الفيديو المعتمدة على معدل الإطارات. كما قمنا بتقييم مجموعة الميزات المدمجة على قواعد بيانات قياسية لـ VQA غير HFR، وحصلنا على أداء أفضل من كلا النموذجين (GREED وVMAF)، مما يدل على أن المجموعة المدمجة للسمات تمكّن من التقاط معلومات جودة بصرية مكملة.