Zweistufiger Ansatz für die no-reference Bewertung der Videoqualität von Verbrauchern
Smartphones und andere Verbrauchergeräte, die in der Lage sind, Videoinhalte aufzunehmen und diese nahezu in Echtzeit über soziale Medien zu teilen, sind zu einem vertretbaren Preis weit verbreitet. Daher besteht ein wachsender Bedarf an no-reference-Videoqualitätsbewertung (NR-VQA) für von Nutzern erstellte Videoinhalte, die typischerweise durch Aufnahmebeeinträchtigungen gekennzeichnet sind, die qualitativ anders sind als jene, die bei professionell produzierten Videos auftreten. Bislang wurden die meisten in der Fachliteratur vorgestellten NR-VQA-Modelle hauptsächlich zur Bewertung von Codier- und Übertragungsverzerrungen entwickelt, nicht jedoch zur Beurteilung von Aufnahmebeeinträchtigungen. Zudem sind die genauesten in der Fachliteratur bekannten NR-VQA-Verfahren oft rechenintensiv und daher für viele praktische Anwendungen unpraktikabel. In diesem Artikel stellen wir einen neuen Ansatz für datenbasierte Videoqualitätsbewertung vor, der darauf beruht, Merkmale auf zwei Ebenen zu berechnen: Zunächst werden niedrigkomplexe Merkmale für die gesamte Videosequenz ermittelt, anschließend werden hochkomplexe Merkmale aus einer ausgewählten Teilmenge repräsentativer Videobilder extrahiert, wobei die Auswahl mittels der niedrigkomplexen Merkmale erfolgt. Wir haben den vorgeschlagenen Ansatz gegenüber mehreren relevanten Benchmark-Methoden anhand dreier kürzlich veröffentlichter annotierter öffentlicher Videoqualitätsdatenbanken verglichen. Unsere Ergebnisse zeigen, dass die vorgeschlagene Methode die subjektive Videoqualität genauer vorhersagen kann als die Benchmark-Methoden. Die bestperformende vorherige Methode erreicht annähernd ähnliche Genauigkeit, jedoch mit deutlich höherem Rechenaufwand.