Plug-and-Play Tri-Branch Invertierbares Block für Bildvergrößerung und -verkleinerung

Hochaufgelöste (HR) Bilder werden häufig auf niedrige Auflösung (LR) heruntergefüllt, um die Bandbreite zu reduzieren, und anschließend wieder hochskaliert, um ihre ursprünglichen Details zu restaurieren. Neuere Fortschritte bei Bildreskalierungsalgorithmen haben invertierbare Neuronale Netze (INNs) eingesetzt, um ein einheitliches Framework für Herunterskalierung und Hochskalierung zu schaffen, das eine eindeutige Zuordnung zwischen LR- und HR-Bildern gewährleistet. Traditionelle Methoden, die auf dualen Zweigen basierende einfache invertierbare Blöcke verwenden, verarbeiten hochfrequente und niederfrequente Informationen getrennt und modellieren oft hochfrequente Komponenten mit spezifischen Verteilungen. Die direkte Verarbeitung der niederfrequenten Komponente im RGB-Bereich führt jedoch zu Kanalredundanz, was die Effizienz der Bildrekonstruktion einschränkt. Um diese Herausforderungen zu bewältigen, schlagen wir einen plug-and-play dreigliedrigen invertierbaren Block (T-InvBlocks) vor, der den niederfrequenten Zweig in Helligkeits- (Y) und Farbunterschieds- (CbCr) Komponenten zerlegt, wodurch Redundanz reduziert und die Featureverarbeitung verbessert wird. Zudem setzen wir während der Hochskalierung eine Nullzuordnungsstrategie für hochfrequente Komponenten ein, um wesentliche Reskalierungsinformationen innerhalb des LR-Bildes zu konzentrieren. Unsere T-InvBlocks können nahtlos in bestehende Reskalierungsmodelle integriert werden und verbessern die Leistung sowohl bei allgemeinen Reskalierungsaufgaben als auch in Szenarien mit verlustbehafteter Kompression. Ausführliche Experimente bestätigen, dass unsere Methode den Stand der Technik in der Rekonstruktion von HR-Bildern vorantreibt.