Steigerung der Leistung von flussbasierten generativen Super-Resolution-Modellen durch gelerntes Prior

Flow-basierte Super-Resolution-(SR-)Modelle haben erstaunliche Fähigkeiten bei der Erzeugung hochwertiger Bilder demonstriert. Dennoch begegnen diese Methoden während der Bildgenerierung mehreren Herausforderungen, wie beispielsweise Gitterartefakten, explodierenden Inversen und suboptimalen Ergebnissen aufgrund einer festen Sampling-Temperatur. Um diese Probleme zu überwinden, führt diese Arbeit einen bedingten gelernten Prior in die Inferenzphase eines flow-basierten SR-Modells ein. Dieser Prior ist ein latenter Code, der von unserem vorgeschlagenen latente Modul unter Bedingung des niedrigauflösenden Bildes vorhergesagt wird und anschließend durch das Flow-Modell in ein hochauflösendes Bild transformiert wird. Unser Framework ist so gestaltet, dass es nahtlos mit jedem aktuellen flow-basierten SR-Modell integriert werden kann, ohne dessen Architektur oder vortrainierte Gewichte zu verändern. Die Wirksamkeit unseres vorgeschlagenen Frameworks wird durch umfangreiche Experimente und Ablationanalysen evaluiert. Das vorgeschlagene Framework löst erfolgreich alle inhärenten Probleme von flow-basierten SR-Modellen und verbessert deren Leistung in verschiedenen SR-Szenarien. Unser Code ist verfügbar unter: https://github.com/liyuantsao/BFSR