منذ 6 أشهر

الملخص

تقييم جودة الفيديو الذهني دون مرجع (NR-VQA) يُعد مشكلة معقدة وغير محلولة، وذات أهمية كبيرة بالنسبة للتطبيقات الاجتماعية وخدمات البث المباشر. إذ يُعد وجود نماذج فعّالة ودقيقة لتوقع جودة الفيديو أمرًا ضروريًا لمراقبة وتوجيه معالجة المليارات من محتوى مُنشأ من قبل المستخدمين (UGC)، والذي غالبًا ما يكون غير مثالي. ومع ذلك، فإن النماذج الحالية المبنية على نهج NR محدودة في قدرتها على التنبؤ بدقة بجودة الفيديو في البيانات الواقعية، وخاصة تلك التي تُجمع من البيئات الحقيقية ("in-the-wild"). ولتعزيز التقدم في هذا المجال، قمنا بإنشاء أكبر مجموعة بيانات موضوعية لجودة الفيديو على الإطلاق، تضم 39,000 فيديو مُشوهًا من العالم الحقيقي، و117,000 قطعة مكانيّة-زمنيّة محددة (تسمى "v-patches")، و5.5 مليون تقييم إنساني متعلق بالجودة الذهنية. وباستخدام هذه البيانات، طوّرنا نموذجين فريدين لنماذج تقييم جودة الفيديو دون مرجع: (أ) معمارية NR-VQA قائمة على التحليل من المستوى المحلي إلى العام (تسمى PVQ)، والتي تتعلم التنبؤ بجودة الفيديو الشاملة، وتُحقق أداءً متقدمًا على مستوى الدولة في ثلاث مجموعات بيانات مُنشأة من قبل المستخدمين (UGC)، و(ب) محرك خرائط جودة الفيديو المكاني-الزمني الأول من نوعه (يُسمى PVQ Mapper)، الذي يُساعد في تحديد وعرض التشوهات الذهنية في الفضاء والزمن. وسوف نُتيح قاعدة البيانات الجديدة ونماذج التنبؤ المتقدمة فور انتهاء عملية المراجعة.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار