ChipQA: تنبؤ بجودة الفيديو بدون مرجع من خلال شرائح الفضاء-الزمن

نُقدّم نموذجًا جديدًا لتقييم جودة الفيديو دون الحاجة إلى فيديو مرجعي (VQA). يعتمد نهجنا على فكرة جديدة تتمثل في قطع فضائية-زمنية (ST) موضعية للغاية تُسمى "أقراص الفضاء-الزمن" (ST Chips). تُعدّ أقراص الفضاء-الزمن قطعًا موضعية من بيانات الفيديو على امتداد اتجاهات تُمثّل الحركة بشكل غير مباشر. نستخدم نماذج مرتبطة بالتحسس (Perceptually-motivated) ذات نطاق تمرير متوسط (Bandpass) والتطبيع (Normalization) أولاً لمعالجة بيانات الفيديو، ثم نختار أقراص الفضاء-الزمن الموجهة استنادًا إلى مدى مطابقتها لنماذج بارامترية إحصائيات الفيديو الطبيعية. ونُظهر أن المُعاملات التي تصف هذه الإحصائيات يمكن استخدامها بشكل موثوق لتوقع جودة الفيديو، دون الحاجة إلى فيديو مرجعي. يُعدّ النموذج المقترح نموذجًا ضمنيًا لطبيعة الفيديو الفضائي-الزمني الطبيعي، وكذلك انحرافاته عن الطبيعة. قمنا بتدريب النموذج واختباره على عدة قواعد بيانات كبيرة لتقييم جودة الفيديو، ونُظهر أن النموذج يحقق أداءً متقدمًا جدًا بتكاليف منخفضة، دون الحاجة إلى حسابات الحركة.