U-förmiger Transformer zur Verbesserung von Unterwasserbildern

Die Lichtabsorption und -streuung durch Unterwasserimperfektionen führen zu einer schlechten Bildqualität unter Wasser. Die bestehenden datengetriebenen Verfahren zur Unterwasserbildverbesserung (UIE) leiden unter dem Mangel an einem umfangreichen Datensatz, der verschiedene Unterwasserszenarien und hochwertige Referenzbilder enthält. Darüber hinaus wird die ungleichmäßige Dämpfung in verschiedenen Farbkanälen und räumlichen Bereichen für eine optimierte Verbesserung nicht ausreichend berücksichtigt. In dieser Arbeit haben wir einen umfangreichen Unterwasserbild-Datensatz (LSUI) mit 5004 Bildpaaren erstellt und ein U-förmiges Transformer-Netzwerk vorgestellt, bei dem das Transformer-Modell erstmals in die UIE-Aufgabe eingeführt wurde. Das U-förmige Transformer-Netzwerk ist mit einem kanalweise multiskaligen Merkmalsfusionstransformer (CMSFFT)-Modul und einem raumweise globalen Merkmalsmodellierungstransformer (SGFMT)-Modul integriert, die die Aufmerksamkeit des Netzwerks auf Farbkanäle und räumliche Bereiche mit stärkerer Dämpfung verstärken. Gleichzeitig wurde, um den Kontrast und die Sättigung weiter zu verbessern, eine neuartige Verlustfunktion entwickelt, die RGB-, LAB- und LCH-Farbraumkombinationen nach dem Prinzip der menschlichen Sehfähigkeit berücksichtigt. Umfangreiche Experimente mit verfügbaren Datensätzen bestätigen die Stand-des-Wissens-übereinstimmende Leistung der vorgestellten Technik, wobei sie mehr als 2 dB überlegen ist.