Tiefes Bildharmonisierung in Dualen Farbräumen

Die Bildharmonisierung ist ein wesentlicher Schritt bei der Bildkomposition, der das Erscheinungsbild des zusammengesetzten Vordergrunds anpasst, um die Inkonsistenzen zwischen Vorder- und Hintergrund zu beheben. Bestehende Methoden operieren hauptsächlich im korrelierten $RGB$-Farbraum, was zu verflochtenen Merkmalen und einer begrenzten Darstellungsfähigkeit führt. Im Gegensatz dazu bietet der dekorrelierte Farbraum (z.B. $Lab$) dekorrelierte Kanäle, die entwirrte Farb- und Beleuchtungsstatistiken bereitstellen. In dieser Arbeit untersuchen wir die Bildharmonisierung in dualen Farbräumen, die verflochtene $RGB$-Merkmale durch entwirrte $L$, $a$, $b$-Merkmale ergänzt, um den Arbeitsaufwand im Harmonisierungsprozess zu reduzieren. Das Netzwerk besteht aus einem $RGB$-Harmonisierungskern, einem $Lab$-Codierungsmodul und einem $Lab$-Steuerungsmodul. Der Kern ist ein U-Netzwerk, das das zusammengesetzte Bild in ein harmonisiertes Bild übersetzt. Drei Encoder im $Lab$-Codierungsmodul extrahieren unabhängig voneinander drei Steuercodes aus den $L$, $a$, $b$-Kanälen, die verwendet werden, um die Decoder-Merkmale im Harmonisierungskern über das $Lab$-Steuerungsmodul zu beeinflussen. Unser Code und unser Modell sind unter \href{https://github.com/bcmi/DucoNet-Image-Harmonization}{https://github.com/bcmi/DucoNet-Image-Harmonization} verfügbar.