تقييم جودة مقاطع الفيديو في البيئة الطبيعية بشكل أعمى من خلال التدريب المسبق المدرك للجودة وفهم الحركة

يُعد تقييم الجودة الإدراكية للفيديوهات التي تم اقتناؤها في البيئات الطبيعية أمرًا بالغ الأهمية لضمان جودة خدمات الفيديو. ويتسبب عدم توفر مقاطع فيديو مرجعية ذات جودة ممتازة، بالإضافة إلى تعقيد التشوهات الحقيقية، في تحديات كبيرة لهذا النوع من مهام تقييم جودة الفيديو العمياء (BVQA). وعلى الرغم من أن التعلم المنقول القائم على النماذج يُعد نموذجًا فعّالاً وفعالًا في مهام BVQA، إلا أن التحدي يكمن في التوصل إلى ما يجب نقله وكيفية جسر الفجوات بين المجالات لتحقيق تمثيل أفضل للفيديو. في هذا العمل، نقترح نقل المعرفة من قواعد بيانات تقييم جودة الصور (IQA) التي تحتوي على تشوهات حقيقية، بالإضافة إلى قواعد بيانات التعرف على الحركات على نطاق واسع التي تمتلك أنماط حركة غنية. ونعتمد على كلا المجموعتين من البيانات لتعلم مُستخرج الميزات. ونُدرّب النموذج المقترح على قواعد بيانات تقييم جودة الفيديو المستهدفة باستخدام دالة خسارة ترتيب مختلطة قائمة على القوائم. وتشير التجارب الواسعة على ست قواعد بيانات إلى أن طريقة العمل لدينا تُظهر أداءً تنافسيًا جدًا في كل من بيئة التدريب على قاعدة بيانات منفصلة وبيئة التدريب المختلطة. كما نتحقق من منطقية كل مكوّن من مكونات الطريقة المقترحة، ونستكشف طريقة بسيطة لتحسين الأداء بشكل إضافي.