HyperAIHyperAI
vor 9 Tagen

Praktische blinde Bildentrauschung mittels Swin-Conv-UNet und Datensynthese

Kai Zhang, Yawei Li, Jingyun Liang, Jiezhang Cao, Yulun Zhang, Hao Tang, Deng-Ping Fan, Radu Timofte, Luc Van Gool
Praktische blinde Bildentrauschung mittels Swin-Conv-UNet und Datensynthese
Abstract

In den letzten Jahren hat sich die Nutzung tiefer neuronaler Netzwerke zur Lösung des Problems der Bildrauschunterdrückung stark erhöht. Doch die derzeit gängigen Methoden basieren meist auf vereinfachten Rauschannahmen, wie beispielsweise additivem weißem Gaußschem Rauschen (AWGN), JPEG-Kompressionsrauschen oder Rauschen von Kamerasensoren. Ein allgemein gültiges, blindes Rauschunterdrückungsverfahren für reale Bilder bleibt bislang ungelöst. In diesem Artikel versuchen wir, dieses Problem aus der Perspektive der Netzwerkarchitekturgestaltung und der Synthese von Trainingsdaten anzugehen. Konkret schlagen wir für die Netzwerkarchitekturgestaltung einen Swin-Conv-Block vor, der die lokale Modellierungsfähigkeit eines residualen konvolutionellen Layers mit der nicht-lokalen Modellierungsfähigkeit eines Swin-Transformer-Blocks kombiniert. Dieser Block wird anschließend als zentrales Bauelement in die weit verbreitete UNet-Architektur für Bild-zu-Bild-Übersetzungen integriert. Für die Synthese von Trainingsdaten entwerfen wir ein praktikables Rauschmodell, das verschiedene Rauscharten (einschließlich Gauß-, Poisson-, Speckle-Rauschen, JPEG-Kompressionsrauschen sowie verarbeitetes Rauschen von Kamerasensoren) sowie Skalierung berücksichtigt. Zudem implementieren wir eine zufällige Shuffling-Strategie und eine Doppel-Degradationsstrategie. Umfangreiche Experimente zur Entfernung von AWGN und zur Rauschunterdrückung bei realen Bildern zeigen, dass die neue Netzwerkarchitektur eine state-of-the-art-Leistung erzielt und dass das neue Degradationsmodell die Praktikabilität erheblich verbessert. Wir sind überzeugt, dass unsere Arbeit wertvolle Erkenntnisse für die aktuelle Forschung im Bereich der Bildrauschunterdrückung liefern kann.

Praktische blinde Bildentrauschung mittels Swin-Conv-UNet und Datensynthese | Neueste Forschungsarbeiten | HyperAI