HyperAIHyperAI

Command Palette

Search for a command to run...

Patch-VQ: "إعادة تجميع" مشكلة جودة الفيديو

Zhenqiang Ying Maniratnam Mandal Deepti Ghadiyaram Alan Bovik

الملخص

تقييم جودة الفيديو الذهني دون مرجع (NR-VQA) يُعد مشكلة معقدة وغير محلولة، وذات أهمية كبيرة بالنسبة للتطبيقات الاجتماعية وخدمات البث المباشر. إذ يُعد وجود نماذج فعّالة ودقيقة لتوقع جودة الفيديو أمرًا ضروريًا لمراقبة وتوجيه معالجة المليارات من محتوى مُنشأ من قبل المستخدمين (UGC)، والذي غالبًا ما يكون غير مثالي. ومع ذلك، فإن النماذج الحالية المبنية على نهج NR محدودة في قدرتها على التنبؤ بدقة بجودة الفيديو في البيانات الواقعية، وخاصة تلك التي تُجمع من البيئات الحقيقية ("in-the-wild"). ولتعزيز التقدم في هذا المجال، قمنا بإنشاء أكبر مجموعة بيانات موضوعية لجودة الفيديو على الإطلاق، تضم 39,000 فيديو مُشوهًا من العالم الحقيقي، و117,000 قطعة مكانيّة-زمنيّة محددة (تسمى "v-patches")، و5.5 مليون تقييم إنساني متعلق بالجودة الذهنية. وباستخدام هذه البيانات، طوّرنا نموذجين فريدين لنماذج تقييم جودة الفيديو دون مرجع: (أ) معمارية NR-VQA قائمة على التحليل من المستوى المحلي إلى العام (تسمى PVQ)، والتي تتعلم التنبؤ بجودة الفيديو الشاملة، وتُحقق أداءً متقدمًا على مستوى الدولة في ثلاث مجموعات بيانات مُنشأة من قبل المستخدمين (UGC)، و(ب) محرك خرائط جودة الفيديو المكاني-الزمني الأول من نوعه (يُسمى PVQ Mapper)، الذي يُساعد في تحديد وعرض التشوهات الذهنية في الفضاء والزمن. وسوف نُتيح قاعدة البيانات الجديدة ونماذج التنبؤ المتقدمة فور انتهاء عملية المراجعة.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp