Qwen-Image-Edit: オールラウンドな画像編集モデルデモ

1. チュートリアルの概要

GitHubスター

Qwen-Image-Editは、アリババ同義千文チームが2025年8月にリリースしたオールラウンドな画像編集モデルです。このモデルは意味編集と外観編集の両方の機能を備えており、低レベルの視覚的外観編集(要素の追加、削除、変更など)と高レベルの視覚的意味編集(IP作成、オブジェクトの回転、スタイル転送など)を実行できます。このモデルは、中国語と英語のバイリンガルテキストの正確な編集をサポートし、画像内のテキストを元のフォント、フォントサイズ、スタイルを維持しながら修正することをサポートします。関連論文の結果は「Qwen-Image 技術レポート”。

このチュートリアルでは、デュアルカード RTX A6000 リソースを使用します。

2. プロジェクト例

3. 操作手順

1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

2. 使用手順

「Bad Gateway」と表示される場合、モデルが初期化中であることを意味します。モデルが大きいため、2〜3分ほど待ってページを更新してください。

パラメータの説明

  • 詳細設定:
    • シード: ランダムシード。
    • ランダムシード: ランダムシードを生成するかどうか。
    • 真のガイダンス スケール: 生成される画像の品質を制御するために使用されるガイダンス スケール。
    • 推論ステップ数: 生成される画像の詳細レベルを制御するために使用される推論ステップの数。
    • プロンプトごとの画像数: プロンプトごとに生成される画像の数を制御します。
    • プロンプトの書き換え: プロンプトの単語を自動的に修正するかどうか。

4. 議論

🖌️ 高品質のプロジェクトを見つけたら、メッセージを残してバックグラウンドで推奨してください。さらに、チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に参加し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりできます。

引用情報

Githubユーザーに感謝 xxxjjjyyy1  このチュートリアルの展開。このプロジェクトの引用情報は次のとおりです。

@misc{wu2025qwenimagetechnicalreport,
      title={Qwen-Image Technical Report}, 
      author={Chenfei Wu and Jiahao Li and Jingren Zhou and Junyang Lin and Kaiyuan Gao and Kun Yan and Sheng-ming Yin and Shuai Bai and Xiao Xu and Yilei Chen and Yuxiang Chen and Zecheng Tang and Zekai Zhang and Zhengyi Wang and An Yang and Bowen Yu and Chen Cheng and Dayiheng Liu and Deqing Li and Hang Zhang and Hao Meng and Hu Wei and Jingyuan Ni and Kai Chen and Kuan Cao and Liang Peng and Lin Qu and Minggang Wu and Peng Wang and Shuting Yu and Tingkun Wen and Wensen Feng and Xiaoxiao Xu and Yi Wang and Yichang Zhang and Yongqiang Zhu and Yujia Wu and Yuxuan Cai and Zenan Liu},
      year={2025},
      eprint={2508.02324},
      archivePrefix={arXiv},
      primaryClass={cs.CV},
      url={https://arxiv.org/abs/2508.02324}, 
}