2ヶ月前
ネガティブプロンプト逆転:テキストガイダンス拡散モデルを使用した高速画像逆転編集
Daiki Miyake; Akihiro Iohara; Yu Saito; Toshiyuki Tanaka

要約
画像編集における拡散モデルの利用においては、スタイルを変更しつつも元の画像の再構築忠実度を保つことが重要です。既存の手法では最適化を通じて再構築忠実度を確保していますが、これらの手法には最適化に必要な時間が多くかかることという欠点があります。本論文では、最適化を必要とせずに前向き伝播だけで同等の再構築を達成できるネガティブプロンプト逆転法(negative-prompt inversion)を提案します。これにより超高速な編集プロセスが可能となります。実験結果から、当手法の再構築忠実度は既存手法と比較可能なレベルであり、512ピクセル解像度で50サンプリングステップを使用して約5秒以内に逆転が可能であることが示されました。これはnull-text逆転法よりも30倍以上速いです。提案手法による計算時間の短縮により、拡散モデルでのサンプリングステップ数を増やして再構築忠実度を向上させつつ、計算時間を適度に増加させることが可能となりました。