HyperAIHyperAI

Command Palette

Search for a command to run...

MUSIQ: Multi-scale Image Quality Transformer

Junjie Ke Qifei Wang Yilin Wang Peyman Milanfar Feng Yang

Zusammenfassung

Die Bildqualitätsbewertung (Image Quality Assessment, IQA) ist ein zentrales Forschungsthema zur Verbesserung und Vertiefung des visuellen Erlebnisses. Aktuelle state-of-the-art IQA-Methoden basieren auf konvolutionellen neuronalen Netzwerken (Convolutional Neural Networks, CNNs). Die Leistungsfähigkeit von CNN-basierten Modellen wird häufig durch die feste Formbeschränkung bei der Batch-Training-Phase beeinträchtigt. Um diesem Problem zu begegnen, werden Eingabebilder üblicherweise auf eine feste Größe skaliert und beschnitten, was zu einer Degradierung der Bildqualität führt. Um dies zu überwinden, entwickeln wir einen mehrskaligen Bildqualitäts-Transformer (MUSIQ), der native Auflösungen mit unterschiedlichen Größen und Seitenverhältnissen verarbeiten kann. Durch eine mehrskalige Bildrepräsentation kann unsere vorgeschlagene Methode die Bildqualität auf verschiedenen Granularitätsstufen erfassen. Zudem wird ein neuartiges, hashbasiertes 2D-Raum-Einbettungsschema sowie eine Skaleneinbettung vorgestellt, um die Positionseinhaltung in der mehrskaligen Darstellung zu unterstützen. Experimentelle Ergebnisse bestätigen, dass unsere Methode auf mehreren großen IQA-Datensätzen wie PaQ-2-PiQ, SPAQ und KonIQ-10k state-of-the-art Leistung erzielt.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp