Qwen-Image: 고급 텍스트 렌더링 기능을 갖춘 이미지 모델
1. 튜토리얼 소개

Qwen-Image는 Alibaba Tongyi Qianwen 팀이 2025년 8월에 출시한 고품질 이미지 생성 및 편집을 위한 대형 모델입니다. 이 모델은 텍스트 렌더링 분야에서 획기적인 발전을 이루었으며, 중국어와 영어 모두에서 여러 줄로 된 단락의 고충실도 출력을 지원하고, 복잡한 장면과 밀리미터 단위의 디테일을 정확하게 복원할 수 있습니다. Qwen-Image는 멀티태스크 협업 학습 패러다임을 사용하여 이미지 편집 시 픽셀 수준의 일관성을 확보하여 전체 과정에서 피사체, 빛과 그림자, 질감의 드리프트를 완벽하게 방지합니다. 사실주의, 애니메이션, 사이버펑크, SF, 미니멀리즘, 복고, 초현실주의, 수묵화 등 수십 가지 스타일을 한 번의 클릭으로 생성할 수 있으며, 스타일 변환, 요소 추가 및 삭제, 디테일 향상, 텍스트 다시 그리기, 자세 재설정과 같은 입체적인 미세 작업을 지원합니다. 관련 논문 결과는 "Qwen-Image 기술 보고서".
이 튜토리얼에서는 듀얼 카드 RTX A6000 리소스를 사용합니다.
2. 프로젝트 예시

3. 작업 단계
1. 컨테이너 시작 후 API 주소를 클릭하여 웹 인터페이스로 진입합니다.

2. 사용 단계
"잘못된 게이트웨이"가 표시되면 모델이 초기화 중임을 의미합니다. 모델이 크기 때문에 약 2~3분 정도 기다리신 후 페이지를 새로고침해 주시기 바랍니다.

매개변수 설명
- 고급 설정:
- 부정적 프롬프트: 부정적 프롬프트 단어는 이미지에 나타나지 않기를 원하는 콘텐츠나 스타일을 지정하는 데 사용됩니다.
- 시드: 무작위 시드.
- 시드 무작위화: 시드를 자동으로 무작위로 지정할지 여부입니다.
- 이미지 크기(비율): 출력 이미지의 해상도 비율을 제어합니다.
- 안내 척도: 안내 척도는 생성된 이미지의 품질을 제어하는 데 사용됩니다.
- 추론 단계 수: 생성된 이미지의 세부 수준을 제어하는 데 사용되는 추론 단계 수입니다.
4. 토론
🖌️ 고품질 프로젝트를 발견하시면, 백그라운드에 메시지를 남겨 추천해주세요! 또한, 튜토리얼 교환 그룹도 만들었습니다. 친구들의 QR코드 스캔과 [SD 튜토리얼] 댓글을 통해 그룹에 가입하여 다양한 기술 이슈에 대해 논의하고 신청 결과를 공유해 주시기 바랍니다.↓

인용 정보
이 프로젝트에 대한 인용 정보는 다음과 같습니다.
@article{qwen-image,
title={Qwen-Image Technical Report},
author={Qwen Team},
journal={arXiv preprint},
year={2025}
}