KonIQ-10k: Eine ökologisch gültige Datenbank für das Deep Learning der blinden Bildqualitätsbewertung

Deep-Learning-Methoden zur Bildqualitätsbewertung (Image Quality Assessment, IQA) sind aufgrund der geringen Größe bestehender Datensätze begrenzt. Umfangreiche Datensätze erfordern erhebliche Ressourcen sowohl für die Erzeugung von publikationsfähigen Inhalten als auch für deren präzise Annotation. Wir präsentieren einen systematischen und skalierbaren Ansatz zur Erstellung von KonIQ-10k, dem bislang größten IQA-Datensatz mit insgesamt 10.073 qualitätsbewerteten Bildern. Es handelt sich um den ersten „in-the-wild“-Datensatz, der auf ökologische Validität abzielt – insbesondere hinsichtlich der Authentizität von Verzerrungen, der Vielfalt der Inhalte und der Qualität bezogenen Indikatoren. Durch den Einsatz von Crowdsourcing sammelten wir 1,2 Millionen zuverlässige Qualitätsbewertungen von 1.459 Crowd-Arbeitern, was den Weg für allgemeinere IQA-Modelle ebnen soll. Wir stellen ein neuartiges, tiefes Lernmodell (KonCept512) vor, das eine hervorragende Generalisierung über den Testdatensatz hinaus zeigt (0,921 SROCC) und somit die derzeit beste Leistung auf dem State-of-the-Art-Datensatz LIVE-in-the-Wild (0,825 SROCC) erreicht. Die zentrale Leistungsfähigkeit des Modells basiert auf der InceptionResNet-Architektur, wobei es mit einer höheren Auflösung als frühere Modelle trainiert wurde (512×384). Eine Korrelationsanalyse zeigt, dass KonCept512 eine Leistung erzielt, die vergleichbar ist mit der von neun subjektiven Bewertungen pro Testbild.