Unüberwachte Kreuzdomänen-Bildgenerierung

Wir untersuchen das Problem der Übertragung eines Beispiels von einem Bereich in ein analoges Beispiel in einem anderen Bereich. Gegeben seien zwei verwandte Bereiche, S und T, wir möchten eine generative Funktion G lernen, die ein Eingabebeispiel aus S auf den Bereich T abbildet, so dass das Ausgabeergebnis einer gegebenen Funktion f, die Eingaben aus beiden Bereichen akzeptiert, unverändert bleibt. Neben der Funktion f sind die Trainingsdaten unüberwacht und bestehen aus einer Reihe von Beispielen aus jedem Bereich. Das vorgestellte Domain Transfer Network (DTN) verwendet eine zusammengesetzte Verlustfunktion, die einen multiklassen-GAN-Verlust, ein f-Konstanzenkomponente und eine Regularisierungskomponente umfasst, die G dazu anregt, Beispiele aus T auf sich selbst abzubilden. Wir wenden unsere Methode auf visuelle Bereiche an, darunter Ziffern und Gesichtsbilder, und zeigen ihre Fähigkeit nach, überzeugende neue Bilder bisher nicht gesehener Entitäten zu generieren, während deren Identität erhalten bleibt.