WaveMixSR-V2: Steigerung der Super-Resolution mit höherer Effizienz

Neuere Fortschritte in der Einzelbild-Super-Resolution werden vorwiegend durch Token-Mixer- und Transformer-Architekturen vorangetrieben. WaveMixSR nutzt die WaveMix-Architektur und setzt eine zweidimensionale diskrete Wavelet-Transformation zur räumlichen Token-Mischung ein, wodurch eine herausragende Leistung bei Super-Resolution-Aufgaben mit bemerkenswerter Ressourceneffizienz erzielt wird. In dieser Arbeit präsentieren wir eine verbesserte Version der WaveMixSR-Architektur, indem wir (1) die herkömmliche Transponierte-Faltung durch eine Pixel-Shuffle-Operation ersetzen und (2) ein mehrstufiges Design für Aufgaben mit höherer Auflösung ($4\times$) implementieren. Unsere Experimente zeigen, dass unser verbessertes Modell – WaveMixSR-V2 – in mehreren Super-Resolution-Aufgaben andere Architekturen übertrifft und für die BSD100-Datenmenge den Stand der Technik erreicht, gleichzeitig jedoch weniger Ressourcen verbraucht, eine höhere Parameter-Effizienz aufweist, geringere Latenz aufweist und eine höhere Durchsatzleistung bietet. Unser Quellcode ist unter https://github.com/pranavphoenix/WaveMixSR verfügbar.