Command Palette
Search for a command to run...
Wavelet-SRNet: Ein wellenbasiertes CNN für die Multi-Skalen-Gesichts-Super-Resolution
Wavelet-SRNet: Ein wellenbasiertes CNN für die Multi-Skalen-Gesichts-Super-Resolution
Tieniu Tan Zhenan Sun Huaibo Huang Ran He
Zusammenfassung
Die meisten modernen Methoden zur Gesichts-Super-Resolution setzen auf Faltungsneuronale Netze (CNN) zur Schätzung hochauflösender (HR) Gesichtsbilder. Bei der Verarbeitung von sehr niedrigauflösenden (LR) Bildern verschlechtert sich die Leistung dieser CNN-basierten Ansätze erheblich. Gleichzeitig neigen diese Methoden dazu, überglattete Ausgaben zu erzeugen und bestimmte texturale Details zu übersehen. Um diesen Herausforderungen zu begegnen, präsentiert dieser Artikel einen wellenbasierten CNN-Ansatz, der in einem einheitlichen Rahmen ein sehr niedrigauflösendes Gesichtsbild mit einer Auflösung von 16×16 Pixel oder weniger auf eine größere Version mit mehreren Skalierungsfaktoren (2×, 4×, 8× und sogar 16×) ultra-auflösen kann. Im Gegensatz zu herkömmlichen CNN-Methoden, die direkt hochauflösende Bilder schätzen, lernt unser Ansatz zunächst, die entsprechenden Serien von Hochauflösungs-Wavelet-Koeffizienten des niedrigauflösenden Bildes vorherzusagen, bevor die HR-Bilder aus diesen Koeffizienten rekonstruiert werden. Um sowohl globale Topologieinformationen als auch lokale Texturdetails menschlicher Gesichter zu erfassen, stellen wir ein flexibles und erweiterbares Faltungsneuronales Netz mit drei Arten von Verlustfunktionen vor: Wavelet-Vorhersageverlust, Texturverlust und Vollbildverlust. Umfangreiche Experimente zeigen, dass der vorgeschlagene Ansatz sowohl quantitativ als auch qualitativ überzeugendere Ergebnisse erzielt als aktuelle State-of-the-Art-Methoden der Super-Resolution.