KV-Edit 背景の一貫性画像編集
1. チュートリアルの概要

KV-Editプロジェクトは、清華大学人工知能学院によって2025年2月25日に開始されました。このモデルは、元の画像と編集後の画像の背景の一貫性を厳密に維持できるトレーニング不要の画像編集手法であり、オブジェクトの追加、削除、置換などのさまざまな編集タスクで優れたパフォーマンスを実現しています。 KV-Edit の中核は、KV キャッシュを使用してバックグラウンド タグのキーと値のペアを保存することです。画像反転プロセス中に、これらのキーと値のペアは保持され、ノイズ除去段階で前景コンテンツと結合され、背景とシームレスに統合された新しいコンテンツが生成されます。このアプローチにより、複雑なメカニズムや高価なトレーニングの必要性が回避され、背景の一貫性と全体的な画像品質が保証されます。関連する論文の結果は以下の通りである。KV-Edit: 背景を正確に保存するトレーニング不要の画像編集”。

このチュートリアルでは、単一カード A6000 のリソースを使用します。
👉 このプロジェクトでは、次の 2 つのモデルのモデルが提供されます。
- ブラックフォレストラボ/FLUX.1-devFLUX.1 [dev]は、テキスト記述から画像を生成できる120億のパラメータ整流ストリームトランスフォーマーです。
- black-forest-labs/FLUX.1-schnellFLUX.1 [schnell] は、テキスト記述から画像を生成できる 120 億パラメータ整流フロー変換器です。
プロジェクト例

2. 操作手順
1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります
「Bad Gateway」と表示される場合、モデルが初期化中であることを意味します。モデルが大きいため、1〜2分ほど待ってページを更新してください。
2. Web ページに入ると、モデルと会話を開始できます。
手順:
1️⃣ 編集したい写真をアップロードします。
2️⃣ ソースキューワードを入力し、「反転」ボタンをクリックして画像の反転を実行します。
3️⃣ ブラシツールを使用して、マスク領域をペイントします。
4️⃣ ターゲットキューを入力し、ハイパーパラメータを調整します。
5️⃣ 「編集」ボタンをクリックして、編集した画像を生成します。
❗️重要な使用上のヒント:
- 画像は100 KBを超えることはできません。
- 反転ベースのバージョンを使用する場合は、各画像を 1 回反転するだけで済み、その後は手順 3 ~ 5 を繰り返して複数回の編集を試行できます。
- re_init は、反転された結果ではなく、ノイズがブレンドされた画像を使用して新しいコンテンツを生成することを意味します。
- attn_mask オプションがチェックされている場合、反転を実行する前にマスクを入力する必要があります。
- マスクが大きく、スキップ ステップや re_init の使用が少ない場合、マスクされた領域の内容が背景と不連続になる可能性があります。 attn_scale を増やしてみるのも良いでしょう。
- inverse は反転を意味し、edit は背景を削除する編集を意味します。
- スキップ ステップ数は、スキップ ステップの数を制御します。
- 反転ガイダンス 反転ガイダンスパラメータ。
- ノイズ除去ガイダンス ノイズ低減ガイダンス パラメータ。

交流とディスカッション
🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。

引用情報
Githubユーザーに感謝 ジャンジュンチャン このチュートリアルの展開では、プロジェクト参照情報は次のとおりです。
@article{zhu2025kv,
title={KV-Edit: Training-Free Image Editing for Precise Background Preservation},
author={Zhu, Tianrui and Zhang, Shiyi and Shao, Jiawei and Tang, Yansong},
journal={arXiv preprint arXiv:2502.17363},
year={2025}
}