HyperAIHyperAI
منذ 11 أيام

استكشاف تقييم جودة الفيديو في المحتوى الذي يُنشئه المستخدم من منظورين جمالي وتقني

Haoning Wu, Erli Zhang, Liang Liao, Chaofeng Chen, Jingwen Hou, Annan Wang, Wenxiu Sun, Qiong Yan, Weisi Lin
استكشاف تقييم جودة الفيديو في المحتوى الذي يُنشئه المستخدم من منظورين جمالي وتقني
الملخص

يُحتمل أن يُسهم الزيادة السريعة في مقاطع الفيديو التي يُنتجها المستخدمون (UGC) في الحاجة إلى تطوير خوارزميات فعّالة لتقييم جودة الفيديو (VQA). ومع ذلك، لا تزال الغاية من مشكلة تقييم جودة الفيديو التي يُنتجها المستخدمون غير واضحة، ويمكن النظر إليها من وجهتين: المنظور التقني، الذي يقيس إدراك التشوهات؛ والمنظور الجمالي، الذي يرتبط بالتفضيلات والتوصيات المتعلقة بالمحتوى. وللتفهم الأعمق لكيفية تأثير هذين الجانبين على الآراء الموضوعية الشاملة في سياق تقييم جودة الفيديو الذي يُنتج بواسطة المستخدمين، نُجري دراسة موضوعية على نطاق واسع لجمع آراء البشر حول جودة الفيديو الشاملة، فضلاً عن آرائهم من الناحيتين الجمالية والتقنية. ويؤكد قاعدة بيانات جودة الفيديو المنفصلة (DIVIDE-3k) التي تم جمعها أن آراء البشر حول جودة مقاطع الفيديو التي يُنتجها المستخدمون تتأثر بشكل عام وحتمي بالجانبين الجمالي والتقني معًا. استجابةً لذلك، نقترح "مُقيّم الجودة الفيديوية الكائني المُفصّل" (DOVER)، الذي يتعلم جودة مقاطع الفيديو التي يُنتجها المستخدمون بناءً على هذين الجانبين. ويُثبت DOVER أداءً يُعدّ من أفضل الأداء في مجال تقييم جودة الفيديو التي يُنتجها المستخدمون، وبكفاءة عالية جدًا. وبالاعتماد على آراء الجوانب المُفصّلة في قاعدة بيانات DIVIDE-3k، نقترح كذلك DOVER++، وهي أول منهجية توفر تقييمات جودة موثوقة وواضحة من منظور جمالي أو تقني واحد فقط. الكود متاح عبر: https://github.com/VQAssessment/DOVER.