ST-GREED: Raum-Zeit-Verallgemeinerte Entropiedifferenzen für die rahmengeschwindigkeitsabhängige Videoqualitätsvorhersage

Wir betrachten das Problem der frame rate-abhängigen Videoqualitätsbewertung (VQA) für Videos mit unterschiedlichen Frame-Raten, einschließlich hochauflösender Frame-Raten (HFR-Videos). Allgemeiner untersuchen wir, wie die wahrgenommene Qualität von der Frame-Rate beeinflusst wird und wie Frame-Rate und Kompression gemeinsam die wahrgenommene Qualität beeinflussen. Wir entwickeln ein objektives VQA-Modell namens Space-Time GeneRalized Entropic Difference (GREED), das die Statistiken von räumlichen und zeitlichen Bandpass-Videokoeffizienten analysiert. Eine verallgemeinerte Gauß-Verteilung (GGD) wird verwendet, um die Bandpass-Antworten zu modellieren, während Entropievariationen zwischen Referenz- und gestörten Videos unter dem GGD-Modell genutzt werden, um Qualitätsvariationen infolge von Frame-Rate-Änderungen zu erfassen. Die entropischen Unterschiede werden über mehrere zeitliche und räumliche Teilbänder berechnet und mittels eines gelernten Regressors zusammengeführt. Durch umfangreiche Experimente zeigen wir, dass GREED im Vergleich zu bestehenden VQA-Modellen die derzeit beste Leistung auf der LIVE-YT-HFR-Datenbank erzielt. Die in GREED verwendeten Merkmale sind hochgeneralisierbar und erzielen auch auf standardmäßigen, nicht-HFR-VQA-Datenbanken konkurrenzfähige Ergebnisse. Die Implementierung von GREED ist online verfügbar: https://github.com/pavancm/GREED