HyperAIHyperAI
vor 7 Tagen

Norm-in-Norm Loss mit schnellerer Konvergenz und besserer Leistung für die Bildqualitätsbewertung

Dingquan Li, Tingting Jiang, Ming Jiang
Norm-in-Norm Loss mit schnellerer Konvergenz und besserer Leistung für die Bildqualitätsbewertung
Abstract

Derzeit werden die meisten Modelle zur Bildqualitätsbewertung (Image Quality Assessment, IQA) mit der MAE- oder MSE-Verlustfunktion im überwachten Lernansatz trainiert, wobei sich empirisch eine langsame Konvergenz zeigt. Es ist allgemein bekannt, dass Normalisierung die schnelle Konvergenz fördern kann. Daher untersuchen wir die Integration von Normalisierung in die Gestaltung von Verlustfunktionen für IQA. Konkret normalisieren wir zunächst die vorhergesagten Qualitätsbewertungen sowie die entsprechenden subjektiven Qualitätsbewertungen. Anschließend wird der Verlust basierend auf der Norm der Differenzen zwischen diesen normalisierten Werten definiert. Die resultierende „Norm-in-Norm“-Verlustfunktion fördert, dass das IQA-Modell lineare Vorhersagen bezüglich der subjektiven Qualitätsbewertungen trifft. Nach dem Training wird eine Kleinste-Quadrate-Regression angewendet, um die lineare Abbildung von den vorhergesagten Qualitätswerten auf die subjektiven Qualitätswerte zu bestimmen. Gezeigt wird, dass die neue Verlustfunktion eng mit zwei gängigen Bewertungskriterien für IQA (PLCC und RMSE) verknüpft ist. Theoretische Analysen belegen, dass die eingebettete Normalisierung die Stabilität und Vorhersagbarkeit der Gradienten der Verlustfunktion erhöht, was der schnelleren Konvergenz des IQA-Modells förderlich ist. Darüber hinaus wird die Wirksamkeit des vorgeschlagenen Verlusts experimentell anhand einer herausfordernden Aufgabe überprüft: die Qualitätsbewertung von „in-the-wild“-Bildern. Experimente an zwei relevanten Datensätzen (KonIQ-10k und CLIVE) zeigen, dass das neue Verlustkriterium im Vergleich zu MAE oder MSE die Konvergenz des IQA-Modells um etwa das Zehnfache beschleunigt und das endgültige Modell eine bessere Leistung erzielt. Das vorgeschlagene Modell erreicht zudem den Stand der Technik bei der Vorhersagegenauigkeit für diese anspruchsvolle Aufgabe. Um reproduzierbare wissenschaftliche Forschung zu fördern, ist der Quellcode öffentlich unter https://github.com/lidq92/LinearityIQA verfügbar.

Norm-in-Norm Loss mit schnellerer Konvergenz und besserer Leistung für die Bildqualitätsbewertung | Neueste Forschungsarbeiten | HyperAI