Komponenten-Attention-gesteuerter Gesichts-Super-Resolution-Netzwerk: CAGFace

Um die zugrundeliegende Struktur von Gesichtern optimal auszunutzen, sowie die kollektiven Informationen aus Gesichtsdatensätzen und die Zwischenschätzungen während des Upsampling-Prozesses zu integrieren, stellen wir hier ein vollständig konvolutionales mehrstufiges neuronales Netzwerk für die 4×-Superauflösung von Gesichtsbildern vor. Durch die implizite Einführung von gesichtsbestandteilweisen Aufmerksamkeitskarten mittels eines Segmentierungsnetzwerks ermöglichen wir es unserem Netzwerk, sich auf gesichtsinterne Muster zu konzentrieren. Jede Stufe unseres Netzwerks besteht aus einer Stem-Schicht, einem Residual-Backbone und räumlichen Upsampling-Schichten. Wir wenden die Stufen rekursiv an, um ein Zwischenbild zu rekonstruieren, und nutzen anschließend die räumlich in Tiefenform umgewandelten Versionen dieses Bildes, um die Bildqualität schrittweise zu verbessern und zu verfeinern. Unsere Experimente zeigen, dass unsere Methode zur Gesichts-Superauflösung sowohl quantitativ als auch perceptiv über den aktuellen Stand der Technik hinausgeht.