ComfyUI Hunyuan 사용자 정의 비디오 생성 워크플로 튜토리얼
1. 튜토리얼 소개

이 튜토리얼에서는 RTX 4090 카드 하나를 리소스로 사용하며, 비디오 생성에는 약 10분이 소요됩니다. 더 나은 생성 품질을 위해서는 80GB 메모리의 GPU를 사용하는 것이 좋습니다.
HunyuanCustom은 텐센트 Hunyuan 팀이 2025년 5월 9일에 출시한 멀티모달 커스텀 비디오 생성 프레임워크입니다. Hunyuan 비디오 생성 프레임워크를 기반으로 하는 주제 일관성에 중점을 둔 멀티모달 조건부 제어 가능 생성 모델입니다. 텍스트, 이미지, 오디오 및 비디오 입력을 조건으로 주제 일관성이 유지되는 비디오 생성을 지원합니다. HunyuanCustom의 멀티모달 기능을 통해 다양한 후속 작업을 수행할 수 있습니다. 예를 들어, 여러 장의 사진을 입력으로 사용하여 HunyuanCustom은 가상 인물 광고 및 가상 메이크업 실험을 용이하게 할 수 있습니다. 관련 논문 결과는 다음과 같습니다.HunyuanCustom: 맞춤형 비디오 생성을 위한 멀티모달 기반 아키텍처".
이 워크플로 튜토리얼에서는 총 다음 모델 파일을 사용합니다.
- 훈위안_비디오_커스텀_720p_fp8_스케일드.세이프텐서
- llava_llama3_fp16.safetensors
- hunyuan_video_vae_bf16.safetensors
- 클립_l.safetensors
2. 프로젝트 예시
멀티모달 비디오 맞춤화

다양한 응용 프로그램

3. 작업 단계
1. 컨테이너 시작 후 API 주소를 클릭하여 웹 인터페이스로 진입합니다.
"잘못된 게이트웨이"가 표시되면 모델이 초기화 중임을 의미합니다. 모델이 크기 때문에 약 2~3분 정도 기다리신 후 페이지를 새로고침해 주시기 바랍니다.

2. 기능 시연
사용 방법
- 첫 번째 복제본은 로딩을 위해 워크플로 파일을 수동으로 가져와야 합니다.

- 이미지 생성 비디오
이미지 선택

입력 프롬프트

결과 출력
4. 토론
🖌️ 고품질 프로젝트를 발견하시면, 백그라운드에 메시지를 남겨 추천해주세요! 또한, 튜토리얼 교환 그룹도 만들었습니다. 친구들의 QR코드 스캔과 [SD 튜토리얼] 댓글을 통해 그룹에 가입하여 다양한 기술 이슈에 대해 논의하고 신청 결과를 공유해 주시기 바랍니다.↓

인용 정보
이 프로젝트에 대한 인용 정보는 다음과 같습니다.
@misc{hu2025hunyuancustom,
title={HunyuanCustom: A Multimodal-Driven Architecture for Customized Video Generation},
author={Teng Hu and Zhentao Yu and Zhengguang Zhou and Sen Liang and Yuan Zhou and Qin Lin and Qinglin Lu},
year={2025},
eprint={2505.04512},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2505.04512},
}