ComfyUI HunyuanCustom 视频生成工作流教程
一、教程简介

本教程采用资源为单卡 RTX 4090,视频生成大约需要 10 分钟。建议使用具有 80GB 内存的 GPU,以获得更好的生成质量。
HunyuanCustom 是由腾讯混元团队 2025 年 5 月 9 日发布的一个多模态定制视频生成框架,一种基于 Hunyuan Video 生成框架构建的以主题一致性为中心的多模态、条件可控的生成模型。它支持生成以文本、图像、音频和视频输入为条件的主题一致性视频。借助 HunyuanCustom 的多模式功能,可以完成众多下游任务。例如,通过获取多张图片作为输入,HunyuanCustom 可以促进虚拟人体广告和虚拟试妆。相关论文成果为「HunyuanCustom: A Multimodal-Driven Architecture for Customized Video Generation」。
该工作流教程总共使用了下列模型文件:
- hunyuan_video_custom_720p_fp8_scaled.safetensors
- llava_llama3_fp16.safetensors
- hunyuan_video_vae_bf16.safetensors
- clip_l.safetensors
二、项目示例
多模态视频自定义

各种应用

三、运行步骤
1. 启动容器后点击 API 地址即可进入 Web 界面
若显示「Bad Gateway」,这表示模型正在初始化,由于模型较大,请等待约 2-3 分钟后刷新页面。

2. 功能演示
使用步骤
- 首次克隆需要手动导入工作流文件进行加载

- 图生成视频
选择图片

输入 Prompt

结果输出
四、交流探讨
🖌️ 如果大家看到优质项目,欢迎后台留言推荐!另外,我们还建立了教程交流群,欢迎小伙伴们扫码备注【SD 教程】入群探讨各类技术问题、分享应用效果↓

引用信息
本项目引用信息如下:
@misc{hu2025hunyuancustom,
title={HunyuanCustom: A Multimodal-Driven Architecture for Customized Video Generation},
author={Teng Hu and Zhentao Yu and Zhengguang Zhou and Sen Liang and Yuan Zhou and Qin Lin and Qinglin Lu},
year={2025},
eprint={2505.04512},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2505.04512},
}