HyperAIHyperAI
منذ 11 أيام

Patch-VQ: "إعادة تجميع" مشكلة جودة الفيديو

Zhenqiang Ying, Maniratnam Mandal, Deepti Ghadiyaram, Alan Bovik
Patch-VQ: "إعادة تجميع" مشكلة جودة الفيديو
الملخص

تقييم جودة الفيديو الذهني دون مرجع (NR-VQA) يُعد مشكلة معقدة وغير محلولة، وذات أهمية كبيرة بالنسبة للتطبيقات الاجتماعية وخدمات البث المباشر. إذ يُعد وجود نماذج فعّالة ودقيقة لتوقع جودة الفيديو أمرًا ضروريًا لمراقبة وتوجيه معالجة المليارات من محتوى مُنشأ من قبل المستخدمين (UGC)، والذي غالبًا ما يكون غير مثالي. ومع ذلك، فإن النماذج الحالية المبنية على نهج NR محدودة في قدرتها على التنبؤ بدقة بجودة الفيديو في البيانات الواقعية، وخاصة تلك التي تُجمع من البيئات الحقيقية ("in-the-wild"). ولتعزيز التقدم في هذا المجال، قمنا بإنشاء أكبر مجموعة بيانات موضوعية لجودة الفيديو على الإطلاق، تضم 39,000 فيديو مُشوهًا من العالم الحقيقي، و117,000 قطعة مكانيّة-زمنيّة محددة (تسمى "v-patches")، و5.5 مليون تقييم إنساني متعلق بالجودة الذهنية. وباستخدام هذه البيانات، طوّرنا نموذجين فريدين لنماذج تقييم جودة الفيديو دون مرجع: (أ) معمارية NR-VQA قائمة على التحليل من المستوى المحلي إلى العام (تسمى PVQ)، والتي تتعلم التنبؤ بجودة الفيديو الشاملة، وتُحقق أداءً متقدمًا على مستوى الدولة في ثلاث مجموعات بيانات مُنشأة من قبل المستخدمين (UGC)، و(ب) محرك خرائط جودة الفيديو المكاني-الزمني الأول من نوعه (يُسمى PVQ Mapper)، الذي يُساعد في تحديد وعرض التشوهات الذهنية في الفضاء والزمن. وسوف نُتيح قاعدة البيانات الجديدة ونماذج التنبؤ المتقدمة فور انتهاء عملية المراجعة.

Patch-VQ: "إعادة تجميع" مشكلة جودة الفيديو | أحدث الأوراق البحثية | HyperAI