ExpoMamba: Ausnutzung von Frequenz-SSM-Blöcken zur effizienten und effektiven Bildverbesserung

Die Verbesserung von Bildern bei niedrigem Licht bleibt eine herausfordernde Aufgabe in der Computer Vision, wobei bestehende State-of-the-Art-Modelle häufig durch Hardware-Beschränkungen und rechnerische Ineffizienzen eingeschränkt sind, insbesondere bei der Verarbeitung hochauflösender Bilder. Obwohl jüngste Foundational Models wie Transformer und Diffusionsmodelle in verschiedenen Domänen effektiv sind, sind sie auf Edge-Geräten aufgrund ihrer hohen rechnerischen Komplexität und langen Inferenzzeiten begrenzt einsetzbar. Wir stellen ExpoMamba vor, eine neuartige Architektur, die Komponenten des Frequenz-Zustandsraums in einer modifizierten U-Net-Architektur integriert und somit eine Kombination aus Effizienz und Wirksamkeit bietet. Das Modell ist speziell darauf ausgelegt, die Herausforderung gemischter Belichtung zu bewältigen, ein häufiges Problem bei der Verbesserung von Bildern bei niedrigem Licht, gleichzeitig aber rechnerisch effizient zu bleiben. Unsere Experimente zeigen, dass ExpoMamba Bilder bei niedrigem Licht bis zu 2–3-mal schneller verarbeitet als traditionelle Modelle, mit einer Inferenzzeit von 36,6 ms, und eine PSNR-Verbesserung von etwa 15–20 % gegenüber konkurrierenden Modellen erreicht, was es besonders gut für Anwendungen im Echtzeit-Bildverarbeitung geeignet macht.