HyperAIHyperAI
vor 3 Monaten

MambaIR: Ein einfacher Baseline für die Bildrestaurierung mit State-Space-Modellen

Hang Guo, Jinmin Li, Tao Dai, Zhihao Ouyang, Xudong Ren, Shu-Tao Xia
MambaIR: Ein einfacher Baseline für die Bildrestaurierung mit State-Space-Modellen
Abstract

In den letzten Jahren sind erhebliche Fortschritte in der Bildrestaurierung erzielt worden, die vor allem der Entwicklung moderner tiefer neuronaler Netze wie Convolutional Neural Networks (CNNs) und Transformers zuzuschreiben sind. Allerdings leiden bestehende Restaurierungsarchitekturen oft an dem Dilemma zwischen großflächigen Rezeptionsfeldern und effizienter Berechnung, was ihre praktische Anwendung einschränkt. Kürzlich hat das Selective Structured State Space Model, insbesondere die verbesserte Version Mamba, großes Potenzial für die Modellierung langfristiger Abhängigkeiten mit linearer Komplexität gezeigt und damit einen Weg zur Lösung dieses Dilemmas eröffnet. Dennoch treten bei der Standard-Mamba bestimmte Herausforderungen im Bereich der Low-Level-Vision auf, wie etwa das Vergessen lokaler Pixelinformationen und Kanalredundanz. In dieser Arbeit stellen wir eine einfache, aber effektive Baseline namens MambaIR vor, die sowohl lokale Verbesserungen als auch Kanal-Attention einbindet, um die ursprüngliche Mamba zu verbessern. Auf diese Weise nutzt unsere MambaIR die Ähnlichkeit lokaler Pixel aus und reduziert Kanalredundanz. Umfangreiche Experimente belegen die Überlegenheit unseres Ansatzes: So erreicht MambaIR beispielsweise bei der Bild-Super-Resolution bis zu 0,45 dB mehr als SwinIR, wobei der Rechenaufwand vergleichbar bleibt und dennoch ein globales Rezeptionsfeld gewährleistet ist. Der Quellcode ist unter \url{https://github.com/csguoh/MambaIR} verfügbar.

MambaIR: Ein einfacher Baseline für die Bildrestaurierung mit State-Space-Modellen | Forschungsarbeiten | HyperAI