FireFlow : Inversion Rapide du Flux Rectifié pour l'Édition Sémantique d'Images

Bien que les flux rectifiés (ReFlows) avec distillation offrent une méthode prometteuse pour l'échantillonnage rapide, leur transformation d'inversion rapide fait revenir les images à un bruit structuré, et le problème de la récupération et de l'édition subséquente reste non résolu. Cet article introduit FireFlow, une approche zéro-shot simple mais efficace qui hérite du remarquable potentiel des modèles basés sur ReFlow (comme FLUX) en génération tout en étendant leurs capacités à une inversion précise et à une édition en 8 étapes. Nous démontrons d'abord qu'un solveur numérique soigneusement conçu est essentiel pour l'inversion ReFlow, permettant une inversion et une reconstruction précises avec l'exactitude d'un solveur d'ordre deux tout en maintenant l'efficacité pratique de la méthode d'Euler d'ordre un. Ce solveur réalise un accélération de trois fois la vitesse d'exécution par rapport aux techniques d'inversion et d'édition ReFlow les plus avancées actuellement disponibles, tout en produisant des erreurs de reconstruction plus petites et des résultats d'édition supérieurs en mode sans entraînement. Le code est disponible à l'adresse suivante : https://github.com/HolmesShuan/FireFlow{ce lien}.