Negative-Prompt-Inversion: Schnelle Bildinversion für die Bearbeitung mit textgesteuerten Diffusionsmodellen

Beim Bildbearbeitung mit Diffusionsmodellen ist es entscheidend, die Rekonstruktionsgenauigkeit im Vergleich zum Originalbild zu gewährleisten, während dessen Stil verändert wird. Obwohl bestehende Methoden durch Optimierung die Rekonstruktionsgenauigkeit sicherstellen, ist ein Nachteil dieser Methoden die erhebliche Zeit, die für die Optimierung erforderlich ist. In dieser Arbeit schlagen wir eine Methode namens negativer-Prompt-Invertierung vor, die in der Lage ist, eine vergleichbare Rekonstruktion ausschließlich durch Vorwärtspropagation ohne Optimierung zu erreichen und somit ultraschnelle Bearbeitungsprozesse ermöglicht. Wir zeigen experimentell, dass die Rekonstruktionsgenauigkeit unserer Methode den bestehenden Methoden entspricht und eine Invertierung bei einer Auflösung von 512 Pixeln und mit 50 Abtastschritten in etwa fünf Sekunden möglich ist, was mehr als 30-mal schneller ist als die Null-Text-Invertierung. Die Reduzierung der Berechnungszeit durch die vorgeschlagene Methode ermöglicht es uns zudem, eine größere Anzahl von Abtastschritten in Diffusionsmodellen zu verwenden, um die Rekonstruktionsgenauigkeit bei moderatem Anstieg der Berechnungszeit zu verbessern.