Region-adaptive Texture Enhancement für die detaillierte Person-Bild-Synthese

Die Fähigkeit, überzeugende texturale Details zu erzeugen, ist entscheidend für die Qualität synthetischer Personenbilder. Bisherige Methoden folgen typischerweise einer „Warping-basierten“ Strategie, bei der Erscheinungsmerkmale über denselben Pfad propagiert werden wie bei der Pose-Übertragung. Dabei gehen jedoch die meisten feinkörnigen Merkmale aufgrund der Untertemperaturabstufung verloren, was zu übermäßig geglätteten Kleidungsstücken und fehlenden Details in den Ausgabebildern führt. In diesem Paper stellen wir RATE-Net vor, einen neuartigen Ansatz zur Synthese von Personenbildern mit scharfen texturalen Details. Der vorgeschlagene Rahmen nutzt eine zusätzliche Texturen-Verbesserungsmodul, um Erscheinungsmerkmale aus dem Quellbild zu extrahieren und eine feinkörnige Resttexturkarte zu schätzen, welche die grobe Schätzung des Pose-Übertragungsmoduls präzisiert. Zudem haben wir eine effektive alternierende Aktualisierungsstrategie entworfen, um eine wechselseitige Anleitung zwischen den beiden Modulen zu fördern und somit eine bessere Konsistenz von Form und Erscheinung zu erreichen. Experimente auf dem DeepFashion-Benchmark-Datensatz belegen die Überlegenheit unseres Ansatzes gegenüber bestehenden Netzwerken.