Von Patchen zu Bildern (PaQ-2-PiQ): Kartierung des Wahrnehmungsraums der Bildqualität

Die blind- oder no-reference (NR)-Bewertung der subjektiven Bildqualität stellt ein schwieriges, bislang ungelöstes Problem dar, das von großer Bedeutung für die sozialen Medien- und Streamingindustrien ist und täglich Milliarden von Nutzern betrifft. Leider erzielen gängige NR-Vorhersagemodelle auf realen, verfälschten Bildern nur eine schlechte Leistung. Um Fortschritte auf diesem Gebiet voranzutreiben, stellen wir die bislang größte (um ein Vielfaches größer) subjektive Bildqualitätsdatenbank vor, die etwa 40.000 reale, verfälschte Bilder und 120.000 Bildausschnitte umfasst, auf denen wir etwa 4 Millionen menschliche Bewertungen der Bildqualität gesammelt haben. Unter Verwendung dieser Bild- und Ausschnittqualitätslabels haben wir tiefe, regionenbasierte Architekturen entwickelt, die lernen, state-of-the-art-Vorhersagen der globalen Bildqualität sowie nützliche lokale Qualitätskarten zu erzeugen. Zu unseren Innovationen zählen Architekturen zur Bildqualitätsvorhersage, die sowohl globale zu lokalen als auch lokale zu globalen Schlussfolgerungen ermöglichen (durch Rückkopplung).