Command Palette
Search for a command to run...
Qwen-Image: 고급 텍스트 렌더링 기능을 갖춘 이미지 모델
GPU 컴퓨팅 에어드롭
1. 튜토리얼 소개

Qwen-Image는 알리바바의 통이천원(Tongyi Qianwen) 팀에서 2025년 8월에 출시한 고품질 이미지 생성 및 편집 모델입니다. 이 모델은 텍스트 렌더링 분야에서 획기적인 발전을 이루어 중국어와 영어 모두에서 여러 줄로 된 단락을 고화질로 출력할 수 있으며, 복잡한 장면과 밀리미터 수준의 디테일까지 정확하게 재현하는 기능을 갖추고 있습니다. 다중 작업 협업 학습 방식을 통해 이미지 편집 시 픽셀 수준의 일관성을 유지하여 피사체, 조명, 질감 등 모든 요소에서 오차 발생을 최소화합니다. 사실적, 애니메이션, 사이버펑크, SF, 미니멀리즘, 레트로, 초현실주의, 수묵화 등 수십 가지 스타일을 한 번의 클릭으로 생성할 수 있으며, 스타일 전송, 요소 추가 및 삭제, 디테일 강화, 텍스트 재작성, 포즈 재설정 등 모든 차원의 세밀한 작업을 지원합니다. 관련 연구 논문은 별도로 제공됩니다. Qwen-Image 기술 보고서 .
이 튜토리얼에서는 듀얼 카드 RTX A6000 리소스를 사용합니다.
2. 프로젝트 예시

3. 작업 단계
1. 컨테이너 시작 후 API 주소를 클릭하여 웹 인터페이스로 진입합니다.

2. 사용 단계
"잘못된 게이트웨이"가 표시되면 모델이 초기화 중임을 의미합니다. 모델이 크기 때문에 약 2~3분 정도 기다리신 후 페이지를 새로고침해 주시기 바랍니다.

매개변수 설명
- 고급 설정:
- 부정적 프롬프트: 부정적 프롬프트 단어는 이미지에 나타나지 않기를 원하는 콘텐츠나 스타일을 지정하는 데 사용됩니다.
- 시드: 무작위 시드.
- 시드 무작위화: 시드를 자동으로 무작위로 지정할지 여부입니다.
- 이미지 크기(비율): 출력 이미지의 해상도 비율을 제어합니다.
- 안내 척도: 안내 척도는 생성된 이미지의 품질을 제어하는 데 사용됩니다.
- 추론 단계 수: 생성된 이미지의 세부 수준을 제어하는 데 사용되는 추론 단계 수입니다.
4. 토론
🖌️ 고품질 프로젝트를 발견하시면, 백그라운드에 메시지를 남겨 추천해주세요! 또한, 튜토리얼 교환 그룹도 만들었습니다. 친구들의 QR코드 스캔과 [SD 튜토리얼] 댓글을 통해 그룹에 가입하여 다양한 기술 이슈에 대해 논의하고 신청 결과를 공유해 주시기 바랍니다.↓

인용 정보
이 프로젝트에 대한 인용 정보는 다음과 같습니다.
@article{qwen-image,
title={Qwen-Image Technical Report},
author={Qwen Team},
journal={arXiv preprint},
year={2025}
}