HyperAIHyperAI
vor 10 Tagen

SDWNet: Eine geradlinige dilatierte Netzwerkarchitektur mit Wavelet-Transformation für die Bildentschärfung

Wenbin Zou, Mingchao Jiang, Yunchen Zhang, Liang Chen, Zhiyong Lu, Yi Wu
SDWNet: Eine geradlinige dilatierte Netzwerkarchitektur mit Wavelet-Transformation für die Bildentschärfung
Abstract

Die Bildunschärfung ist ein klassisches Problem der Computer Vision, das darauf abzielt, ein scharfes Bild aus einem verschwommenen Bild wiederherzustellen. Um dieses Problem zu lösen, verwenden bestehende Methoden häufig die Encode-Decode-Architektur, um komplexe Netzwerke zu entwerfen, die eine hohe Leistung erzielen. Allerdings nutzen die meisten dieser Ansätze wiederholte Up- und Downsampling-Strukturen, um den Empfindlichkeitsbereich (receptive field) zu vergrößern, was zu einem Verlust an Texturinformationen während des Abtastprozesses führt. Zudem erzeugen einige Ansätze mehrere Stufen, was die Konvergenz des Trainings erschwert. Daher nutzt unser Modell dilatierte Faltung (dilated convolution), um einen großen Empfindlichkeitsbereich bei hoher räumlicher Auflösung zu erreichen. Durch die effiziente Ausnutzung unterschiedlicher Empfindlichkeitsbereiche erzielt unsere Methode eine bessere Leistung. Auf dieser Grundlage reduzieren wir die Anzahl der Up- und Downsampling-Schritte und entwerfen eine vereinfachte Netzwerkarchitektur. Außerdem stellen wir ein neuartiges Modul vor, das die Wavelet-Transformation nutzt, welches dem Netzwerk effektiv hilft, klare hochfrequente Texturdetails wiederherzustellen. Qualitative und quantitative Evaluierungen an realen und synthetischen Datensätzen zeigen, dass unsere Deblurring-Methode im Vergleich zu bestehenden Algorithmen eine vergleichbare Leistung erzielt, jedoch deutlich geringere Trainingsanforderungen aufweist. Der Quellcode und vortrainierte Modelle sind unter https://github.com/FlyEgle/SDWNet verfügbar.