Qwen-Image-Edit: 모든 기능을 갖춘 이미지 편집 모델 데모

1. 튜토리얼 소개

GitHub 스타

Qwen-Image-Edit은 Alibaba Tongyi Qianwen 팀이 2025년 8월에 출시한 만능 이미지 편집 모델입니다. 이 모델은 의미론적 편집 기능과 외관 편집 기능을 모두 갖추고 있으며, 저수준 시각적 외관 편집(예: 요소 추가, 삭제, 수정)과 고수준 시각적 의미론적 편집(예: IP 생성, 객체 회전, 스타일 변환 등)을 수행할 수 있습니다. 이 모델은 중국어 및 영어 이중 언어 텍스트의 정밀한 편집을 지원하며, 원본 글꼴, 글꼴 크기 및 스타일을 유지하면서 이미지의 텍스트를 수정할 수 있도록 지원합니다. 관련 논문 결과는 다음과 같습니다.Qwen-Image 기술 보고서".

이 튜토리얼에서는 듀얼 카드 RTX A6000 리소스를 사용합니다.

2. 프로젝트 예시

3. 작업 단계

1. 컨테이너 시작 후 API 주소를 클릭하여 웹 인터페이스로 진입합니다.

2. 사용 단계

"잘못된 게이트웨이"가 표시되면 모델이 초기화 중임을 의미합니다. 모델이 크기 때문에 약 2~3분 정도 기다리신 후 페이지를 새로고침해 주시기 바랍니다.

매개변수 설명

  • 고급 설정:
    • 시드: 무작위 시드.
    • 난수 시드 생성: 난수 시드를 생성할지 여부입니다.
    • 실제 안내 척도: 생성된 이미지의 품질을 제어하는 데 사용되는 안내 척도입니다.
    • 추론 단계 수: 생성된 이미지의 세부 수준을 제어하는 데 사용되는 추론 단계 수입니다.
    • 프롬프트당 이미지 수: 각 프롬프트에 대해 생성되는 이미지 수를 제어합니다.
    • 프롬프트를 다시 작성: 프롬프트 단어를 자동으로 다듬을지 여부.

4. 토론

🖌️ 고품질 프로젝트를 발견하시면, 백그라운드에 메시지를 남겨 추천해주세요! 또한, 튜토리얼 교환 그룹도 만들었습니다. 친구들의 QR코드 스캔과 [SD 튜토리얼] 댓글을 통해 그룹에 가입하여 다양한 기술 이슈에 대해 논의하고 신청 결과를 공유해 주시기 바랍니다.↓

인용 정보

Github 사용자에게 감사드립니다 xxxjjjyyy1  이 튜토리얼의 배포. 이 프로젝트에 대한 인용 정보는 다음과 같습니다.

@misc{wu2025qwenimagetechnicalreport,
      title={Qwen-Image Technical Report}, 
      author={Chenfei Wu and Jiahao Li and Jingren Zhou and Junyang Lin and Kaiyuan Gao and Kun Yan and Sheng-ming Yin and Shuai Bai and Xiao Xu and Yilei Chen and Yuxiang Chen and Zecheng Tang and Zekai Zhang and Zhengyi Wang and An Yang and Bowen Yu and Chen Cheng and Dayiheng Liu and Deqing Li and Hang Zhang and Hao Meng and Hu Wei and Jingyuan Ni and Kai Chen and Kuan Cao and Liang Peng and Lin Qu and Minggang Wu and Peng Wang and Shuting Yu and Tingkun Wen and Wensen Feng and Xiaoxiao Xu and Yi Wang and Yichang Zhang and Yongqiang Zhu and Yujia Wu and Yuxuan Cai and Zenan Liu},
      year={2025},
      eprint={2508.02324},
      archivePrefix={arXiv},
      primaryClass={cs.CV},
      url={https://arxiv.org/abs/2508.02324}, 
}