MixDehazeNet: Mix-Struktur-Block für ein Bild-Dehazing-Netzwerk

Die Bildentnebelung ist eine typische Aufgabe im Bereich des Low-Level Vision. Frühere Studien haben die Wirksamkeit großer Faltkernels und Aufmerksamkeitsmechanismen bei der Entnebelung bestätigt. Allerdings weisen diese Ansätze zwei Nachteile auf: Bei der Verwendung großer Faltkernels werden die Multiskalen-Eigenschaften eines Bildes leicht vernachlässigt, und die herkömmliche serielle Verkettung eines Aufmerksamkeitsmoduls berücksichtigt die ungleichmäßige Verteilung von Nebel nicht ausreichend. In diesem Artikel stellen wir einen neuen Ansatz namens Mix Structure Image Dehazing Network (MixDehazeNet) vor, der diese beiden Probleme adressiert. Konkret besteht das vorgeschlagene Framework aus zwei Hauptkomponenten: einem Multiskalen-Parallel-Faltkernel-Modul und einem verbesserten Parallel-Aufmerksamkeitsmodul. Im Gegensatz zu einem einzelnen großen Faltkernel sind parallele Faltkerne mit Multiskalen während des Entnebelungsprozesses besser in der Lage, lokale Texturen gezielt zu berücksichtigen. Zudem wurde ein verbessertes Parallel-Aufmerksamkeitsmodul entwickelt, bei dem parallele Verbindungen von Aufmerksamkeitsmechanismen eine überlegene Leistung bei der Entnebelung ungleichmäßig verteilter Nebelregionen erzielen. Umfassende Experimente an drei Standardbenchmarks belegen die Wirksamkeit des vorgeschlagenen Ansatzes. Beispielsweise erreicht MixDehazeNet im Vergleich zu vorherigen State-of-the-Art-Methoden eine signifikante Verbesserung (42,62 dB PSNR) auf dem SOTS-Indoor-Datensatz. Der Quellcode ist unter https://github.com/AmeryXiong/MixDehazeNet veröffentlicht.