Command Palette
Search for a command to run...
HunyuanImage-2.1: 고해상도(2K) Hunyuan 이미지에 대한 확산 모델
1. 튜토리얼 소개

HunyuanImage-2.1은 텐센트 Hunyuan 팀이 2025년 9월에 출시한 오픈소스 문학 이미지 모델입니다. 네이티브 2K 해상도를 지원하고, 강력한 복합 의미 이해 기능을 갖추고 있으며, 장면 세부 정보, 캐릭터 표현 및 동작을 정확하게 생성할 수 있습니다. 이 모델은 중국어 및 영어 입력을 지원하며, 이미지의 텍스트와 세부 정보에 대한 안정적인 제어를 유지하면서 만화, 피규어 등 다양한 스타일의 이미지를 생성할 수 있습니다. 이 모델은 듀얼 채널 텍스트 인코더 및 고압축 VAE와 같은 기술을 기반으로 하여 학습 및 추론 효율성을 크게 향상시킵니다. 관련 논문 결과는 다음과 같습니다.PromptEnhancer: Chain-of-Thought Prompt Rewriting을 통해 텍스트-이미지 모델을 향상시키는 간단한 접근 방식".
이 튜토리얼에서는 컴퓨팅 리소스로 단일 RTX PRO 6000 그래픽 카드를 사용하여 테스트를 위한 텍스트-이미지 생성 및 이미지 개선이라는 두 가지 기능을 제공합니다.
2. 효과 표시
텍스트-이미지 생성

이미지 개선

3. 작업 단계
1. 컨테이너를 시작하세요
"잘못된 게이트웨이"가 표시되면 모델이 초기화 중임을 의미합니다. 모델이 크기 때문에 약 2~3분 정도 기다리신 후 페이지를 새로고침해 주시기 바랍니다.

2. 사용 단계
1. 텍스트-이미지 생성

매개변수 설명:
- 증류 모델 사용: 증류 모델을 사용하면 결과가 더 빨리 나오지만 품질은 약간 떨어집니다.
- 프롬프트: 여기에 텍스트를 입력할 수 있습니다.
- 부정적 프롬프트: AI에게 "아무것도 생성하지 말라"고 알려주는 부정적 프롬프트입니다.
- 화면 비율: 생성된 이미지의 화면 비율을 선택합니다.
- 추론 단계: 추론 단계. 단계가 많을수록 품질은 좋아지지만 생성 속도는 느려집니다.
- 지침 척도: 지시 사항을 얼마나 엄격하게 따르는가.
- 씨앗: 씨앗.
- 이미지 정제 사용: 이미지 정제를 사용할지 여부입니다.
2. 이미지 개선

매개변수 설명:
- 세부 정보 프롬프트: 여기에 텍스트를 입력할 수 있습니다.
- 너비: 출력 이미지 너비.
- 높이: 출력 이미지 높이.
- 개선 단계: 추론 단계를 개선합니다. 단계가 많을수록 품질은 좋아지지만, 생성 속도는 느려집니다.
- 지침 척도: 지시 사항을 얼마나 엄격하게 따르는가.
- 씨앗: 씨앗.
4. 토론
🖌️ 고품질 프로젝트를 발견하시면, 백그라운드에 메시지를 남겨 추천해주세요! 또한, 튜토리얼 교환 그룹도 만들었습니다. 친구들의 QR코드 스캔과 [SD 튜토리얼] 댓글을 통해 그룹에 가입하여 다양한 기술 이슈에 대해 논의하고 신청 결과를 공유해 주시기 바랍니다.↓

인용 정보
이 프로젝트에 대한 인용 정보는 다음과 같습니다.
@misc{HunyuanImage-2.1,
title={HunyuanImage 2.1: An Efficient Diffusion Model for High-Resolution (2K) Text-to-Image Generation},
author={Tencent Hunyuan Team},
year={2025},
howpublished={\url{https://github.com/Tencent-Hunyuan/HunyuanImage-2.1}},
}