Multi-Outputs ist alles, was Sie für Deblur benötigen

Die Aufgabe der Bildunschärfung ist eine schlecht gestellte Aufgabe, bei der unendlich viele mögliche Lösungen für ein verschwommenes Bild existieren. Moderne Ansätze des tiefen Lernens vernachlässigen oft die Schätzung der Unschärfekerne und setzen stattdessen auf end-to-end überwachtes Lernen. Übliche Datensätze für die Bildunschärfung definieren das Label als eine der möglichen Lösungen. Wir argumentieren jedoch, dass es nicht sinnvoll ist, ein Label direkt vorzugeben, insbesondere wenn dieses aus einer zufälligen Verteilung stammt. Daher schlagen wir vor, das Netzwerk zu lehren, die Verteilung der möglichen Lösungen zu erfassen, und entwerfen hierfür eine neuartige Architektur mit mehreren Ausgängen sowie eine entsprechende Verlustfunktion zur Verteilungslernung. Unser Ansatz ermöglicht es dem Modell, mehrere mögliche Lösungen auszugeben, um die Zielverteilung zu approximieren. Darüber hinaus stellen wir eine neuartige Methode zur Parameter-Multiplexing vor, die die Anzahl der Parameter und den Rechenaufwand reduziert, gleichzeitig aber die Leistung verbessert. Wir evaluieren unseren Ansatz an mehreren Bildunschärfungsmodellen, darunter das derzeitige State-of-the-Art-Modell NAFNet. Die Verbesserung des besten Gesamtergebnisses (wählt für jedes Validierungs-Bild den höchsten PSNR-Wert unter allen Ausgängen) übertrifft die Vergleichsmodelle um bis zu 0,11–0,18 dB. Die Verbesserung des besten einzelnen Ausgangs (wählt den am besten performenden Ausgang unter allen Ausgängen auf dem Validierungssatz) übertrifft die Vergleichsmodelle um bis zu 0,04–0,08 dB. Der Quellcode ist unter https://github.com/Liu-SD/multi-output-deblur verfügbar.