HyperAIHyperAI
vor 17 Tagen

BargainNet: hintergrundgesteuerte Domänenübersetzung für die Bildharmonisierung

Wenyan Cong, Li Niu, Jianfu Zhang, Jing Liang, Liqing Zhang
BargainNet: hintergrundgesteuerte Domänenübersetzung für die Bildharmonisierung
Abstract

Die Bildzusammensetzung ist eine grundlegende Operation im Bereich des Bildbearbeitens. Unharmonische Vorder- und Hintergründe mindern jedoch die Qualität der zusammengesetzten Bilder erheblich. Die Bildharmonisierung, die darauf abzielt, die Vordergrundregion anzugleichen, um eine bessere Konsistenz zu erreichen, stellt eine essenzielle, jedoch herausfordernde Aufgabe dar. Bisherige auf tiefen neuronalen Netzen basierende Ansätze konzentrieren sich hauptsächlich auf die direkte Lernung einer Abbildung von zusammengesetzten Bildern auf reale Bilder, wobei die entscheidende Leitfunktion des Hintergrunds vernachlässigt wird. In dieser Arbeit gehen wir davon aus, dass der Vordergrund in denselben Domänenraum wie der Hintergrund transformiert werden muss, und formulieren die Aufgabe der Bildharmonisierung daher als hintergrundgeleitete Domänenübersetzung. Dementsprechend schlagen wir ein neues Bildharmonisierungsnetzwerk vor, das über einen innovativen Domänen-Code-Extraktor und maßgeschneiderte Dreierverlustfunktionen verfügt, um die Domäneninformationen des Hintergrunds zu erfassen und so die Harmonisierung des Vordergrunds gezielt zu leiten. Ausführliche Experimente auf bestehenden Benchmark-Datenbanken für Bildharmonisierung belegen die Wirksamkeit unseres Ansatzes. Der Quellcode ist unter https://github.com/bcmi/BargainNet verfügbar.