Neubewertung des Grob-zu-Fein-Ansatzes bei der Einzelbild-Entschärfung

Groß-zu-klein-Strategien werden umfassend bei der Architekturgestaltung von Einzelbild-Entschärfungsnetzwerken eingesetzt. Traditionelle Methoden stapeln typischerweise Sub-Netzwerke mit mehrskaligen Eingabebildern und verbessern schrittweise die Schärfe der Bilder von unten nach oben, was zwangsläufig hohe Rechenkosten verursacht. Um eine schnelle und genaue Architektur für die Bildentschärfung zu entwickeln, überprüfen wir erneut die Groß-zu-klein-Strategie und stellen ein mehrfach-eingabes, mehrfach-ausgabes U-Net (MIMO-UNet) vor. Das MIMO-UNet weist drei charakteristische Eigenschaften auf. Erstens nimmt der einzige Encoder des MIMO-UNet mehrskalige Eingabebilder auf, um die Trainingskomplexität zu verringern. Zweitens gibt der einzige Decoder des MIMO-UNet mehrere entschärfte Bilder mit unterschiedlichen Skalen aus, um die Funktionalität mehrfach-kaskadierter U-Netzwerke mit einem einzigen U-förmigen Netzwerk nachzuahmen. Drittens wird eine asymmetrische Merkmalsfusion eingeführt, um mehrskalige Merkmale effizient zu kombinieren. Umfangreiche Experimente auf den Datensätzen GoPro und RealBlur zeigen, dass das vorgeschlagene Netzwerk sowohl hinsichtlich Genauigkeit als auch Rechenaufwand die derzeitigen State-of-the-Art-Methoden übertrifft. Der Quellcode steht für Forschungszwecke unter https://github.com/chosj95/MIMO-UNet zur Verfügung.