Mehrstufiges Wavelet-CNN für Bildrestauration

Der Kompromiss zwischen Rezeptorfeldgröße und Effizienz ist ein entscheidendes Problem im Bereich der niedrigstufigen Bildverarbeitung. Einfache Faltungsnetze (CNNs) vergrößern in der Regel das Rezeptorfeld auf Kosten des Rechenaufwands. Kürzlich wurde die dilatierte Filterung als Lösungsansatz für dieses Problem eingesetzt. Allerdings leidet sie unter dem Rastereffekt, und das resultierende Rezeptorfeld ist nur eine dünn besetzte Stichprobe des Eingangsbildes mit karoartigen Mustern. In dieser Arbeit stellen wir ein neues Mehrebenen-Wavelet-CNN (MWCNN)-Modell vor, das einen besseren Kompromiss zwischen Rezeptorfeldgröße und rechnerischer Effizienz bietet. Mit einer modifizierten U-Net-Architektur wird die Wavelet-Transformation eingeführt, um die Größe der Merkmalskarten im zusammenziehenden Teilnetz zu reduzieren. Darüber hinaus wird eine zusätzliche Faltungsschicht verwendet, um die Anzahl der Kanäle der Merkmalskarten zu verringern. Im erweiternden Teilnetz wird dann die inverse Wavelet-Transformation angewendet, um die hochaufgelösten Merkmalskarten wiederherzustellen. Unser MWCNN kann auch als Verallgemeinerung von dilatierter Filterung und Abtastung interpretiert werden und findet Anwendung in vielen Bildrestaurierungsaufgaben. Die experimentellen Ergebnisse zeigen deutlich die Effektivität des MWCNN bei Bildrauschenreduktion, Einzelbild-Superresolution und Entfernung von JPEG-Bildartefakten.