Genaue Bildsuperauflösung mit sehr tiefen Faltungsnetzwerken

Wir präsentieren eine hochgenaue Methode zur Super-Resolution (SR) von einzelnen Bildern. Unser Ansatz verwendet ein sehr tiefes Faltungsnetzwerk, das sich an dem für die ImageNet-Klassifikation verwendeten VGG-Net orientiert \cite{simonyan2015very}. Wir stellen fest, dass die Steigerung der Netzwerktiefe zu einem signifikanten Genauigkeitszuwachs führt. Das endgültige Modell nutzt 20 Gewichtsschichten. Durch das mehrfache Kaskaden von kleinen Filtern in einer tiefen Netzstruktur wird kontextuelle Information über große Bildbereiche effizient genutzt. Bei sehr tiefen Netzwerken wird jedoch die Konvergenzgeschwindigkeit während des Trainings zu einem kritischen Aspekt. Wir schlagen eine einfache, aber effektive Trainingsprozedur vor. Wir lernen nur Residuen und verwenden extrem hohe Lernraten (10(^4) Mal höher als SRCNN \cite{dong2015image}), was durch ein anpassbares Gradientenclipping ermöglicht wird. Unsere vorgeschlagene Methode erzielt bessere Ergebnisse als bestehende Methoden in Bezug auf Genauigkeit, und visuelle Verbesserungen in unseren Resultaten sind leicht erkennbar.