Qwen-Image-Edit-2509: 다중 이미지 편집기

1. 튜토리얼 소개

GitHub 스타

Qwen-Image-Edit-2509는 Alibaba Tongyi Qianwen 팀이 2025년 9월에 출시한 만능 이미지 편집 모델입니다. 8월에 오픈소스로 공개된 Qwen-Image-Edit과 비교했을 때, 새 버전은 단일 이미지 편집의 일관성을 향상시키고 다중 이미지 편집을 새롭게 지원합니다. 깊이 맵, 엣지 맵, 키 포인트 맵을 지원하여 이미지 출력의 제어성과 자유도가 더욱 향상되었습니다.Qwen-Image 기술 보고서".

이 튜토리얼에서는 단일 RTX 4090 카드에 대한 리소스를 사용합니다.

2. 프로젝트 예시

3. 작업 단계

1. 컨테이너 시작 후 API 주소를 클릭하여 웹 인터페이스로 진입합니다.

2. 사용 단계

"잘못된 게이트웨이"가 표시되면 모델이 초기화 중임을 의미합니다. 모델이 크기 때문에 약 2~3분 정도 기다리신 후 페이지를 새로고침해 주시기 바랍니다.

매개변수 설명

  • 고급 설정:
    • 시드: 무작위 시드.
    • 추론 단계: 생성된 이미지의 세부 수준을 제어하는 데 사용되는 추론 단계 수입니다.
    • 실제 CFG 스케일: 스케일이 클수록 완성된 제품이 원본 이미지와 더 유사해지고, 스케일이 작을수록 텍스트 프롬프트가 더 잘 들립니다.
    • 안내 척도: 안내 척도는 생성된 이미지의 품질을 제어하는 데 사용됩니다.

4. 토론

🖌️ 고품질 프로젝트를 발견하시면, 백그라운드에 메시지를 남겨 추천해주세요! 또한, 튜토리얼 교환 그룹도 만들었습니다. 친구들의 QR코드 스캔과 [SD 튜토리얼] 댓글을 통해 그룹에 가입하여 다양한 기술 이슈에 대해 논의하고 신청 결과를 공유해 주시기 바랍니다.↓

인용 정보

이 프로젝트에 대한 인용 정보는 다음과 같습니다.

@misc{wu2025qwenimagetechnicalreport,
      title={Qwen-Image Technical Report}, 
      author={Chenfei Wu and Jiahao Li and Jingren Zhou and Junyang Lin and Kaiyuan Gao and Kun Yan and Sheng-ming Yin and Shuai Bai and Xiao Xu and Yilei Chen and Yuxiang Chen and Zecheng Tang and Zekai Zhang and Zhengyi Wang and An Yang and Bowen Yu and Chen Cheng and Dayiheng Liu and Deqing Li and Hang Zhang and Hao Meng and Hu Wei and Jingyuan Ni and Kai Chen and Kuan Cao and Liang Peng and Lin Qu and Minggang Wu and Peng Wang and Shuting Yu and Tingkun Wen and Wensen Feng and Xiaoxiao Xu and Yi Wang and Yichang Zhang and Yongqiang Zhu and Yujia Wu and Yuxuan Cai and Zenan Liu},
      year={2025},
      eprint={2508.02324},
      archivePrefix={arXiv},
      primaryClass={cs.CV},
      url={https://arxiv.org/abs/2508.02324}, 
}