HyperAIHyperAI
vor 11 Tagen

Bildqualitätsbewertung: Vereinheitlichung von Struktur- und Texturähnlichkeit

Keyan Ding, Kede Ma, Shiqi Wang, Eero P. Simoncelli
Bildqualitätsbewertung: Vereinheitlichung von Struktur- und Texturähnlichkeit
Abstract

Objektive Maße zur Bildqualität arbeiten in der Regel dadurch, dass sie Pixel eines „verminderten“ Bildes mit denen des Originalbildes vergleichen. Im Vergleich zu menschlichen Beobachtern sind diese Maße übermäßig empfindlich gegenüber der Umprobenahme von Texturregionen (z. B. dem Ersetzen eines Graspatches durch einen anderen). In dieser Arbeit entwickeln wir das erste vollständig referenzierte Bildqualitätsmodell mit expliziter Toleranz gegenüber der Umprobenahme von Textur. Mittels eines konvolutionellen neuronalen Netzes konstruieren wir eine injektive und differenzierbare Funktion, die Bilder in mehrskalige, überbestimmte Darstellungen transformiert. Wir zeigen empirisch, dass die räumlichen Mittelwerte der Merkmalskarten in dieser Darstellung die Textur-Ästhetik erfassen, da sie eine Menge ausreichender statistischer Einschränkungen liefern, um eine Vielzahl verschiedener Texturmuster zu synthetisieren. Anschließend beschreiben wir ein Bildqualitätsverfahren, das Korrelationen dieser räumlichen Mittelwerte („Texturähnlichkeit“) mit Korrelationen der Merkmalskarten („Strukturähnlichkeit“) kombiniert. Die Parameter des vorgeschlagenen Maßes werden gemeinsam optimiert, um menschliche Bewertungen der Bildqualität nachzuahmen, während gleichzeitig die gemeldeten Abstände zwischen Teilbildern, die aus denselben Texturbildern geschnitten wurden, minimiert werden. Experimente zeigen, dass das optimierte Verfahren menschliche Wahrnehmungsscores sowohl auf herkömmlichen Bildqualitätsdatenbanken als auch auf Textur-Datenbanken erklärt. Das Maß erzielt zudem konkurrenzfähige Ergebnisse bei verwandten Aufgaben wie Textur-Klassifikation und -Retrieval. Schließlich zeigen wir, dass unser Verfahren relativ unempfindlich gegenüber geometrischen Transformationen (z. B. Translation und Dilatation) ist, ohne dass spezielle Trainings- oder Datenverstärkungstechniken eingesetzt werden müssen. Der Quellcode ist unter https://github.com/dingkeyan93/DISTS verfügbar.

Bildqualitätsbewertung: Vereinheitlichung von Struktur- und Texturähnlichkeit | Neueste Forschungsarbeiten | HyperAI