HyperAIHyperAI
vor 17 Tagen

KonX: Bildqualitätsbewertung mit unterschiedlichen Auflösungen

Oliver Wiedemann, Vlad Hosu, Shaolin Su, Dietmar Saupe
KonX: Bildqualitätsbewertung mit unterschiedlichen Auflösungen
Abstract

Skaleninvarianz ist ein offenes Problem in vielen Teilgebieten der Computer Vision. So sollten Objektbezeichnungen über verschiedene Skalen hinweg konstant bleiben, dennoch weichen die Modellvorhersagen in vielen Fällen ab. Dieses Problem verschärft sich bei Aufgaben, bei denen die ground-truth-Bezeichnungen mit der Darstellungsskala variieren. Bei der Bildqualitätsbewertung (IQA) werden Störungen wie Verschmierungen oder Kompressionsartefakte durch Heruntersampling abgeschwächt, was sich positiv auf die subjektiven Wahrnehmungen in Studien auswirken kann. Um die wahrgenommene Bildqualität genau vorherzusagen, müssen daher cross-resolution-IQA-Methoden sowohl die skalenabhängigen Fehler berücksichtigen, die durch Modellunzulänglichkeiten verursacht werden, als auch die Verlagerungen der wahrnehmungsbasierten Labels im ground truth. Wir präsentieren die erste Studie dieser Art, die diese beiden Probleme getrennt analysiert, und zwar mittels KonX, einer neuartigen, sorgfältig konzipierten cross-resolution-IQA-Datenbank. Der Beitrag dieser Arbeit ist folgendermaßen zusammengestellt: 1. Mittels KonX liefern wir empirische Belege für Label-Verschiebungen, die durch Änderungen der Darstellungsskala verursacht werden. 2. Wir zeigen, dass objektive IQA-Methoden eine Skalenbias aufweisen, die ihre Vorhersageleistung verringert. 3. Wir schlagen eine mehrskalige, mehrspaltige DNN-Architektur vor, die die Leistung gegenüber vorherigen State-of-the-Art-IQA-Modellen, einschließlich neuer Transformer, verbessert. Damit heben wir ein neuartiges Forschungsproblem in der Bildqualitätsbewertung hervor und adressieren es zugleich.

KonX: Bildqualitätsbewertung mit unterschiedlichen Auflösungen | Neueste Forschungsarbeiten | HyperAI