一、教程简介

Wan2.1-VACE-14B 是由阿里巴巴通义万相团队于 2025 年 5 月 15 日开源的全能型视频生成与编辑统一模型。该模型基于通义万相 V2.1 基座训练，是当前业界首个支持多任务灵活组合的视频 AI 工具，能够一站式完成从视频生成到精细化编辑的全流程需求。支持文本到视频、图像到视频、首尾帧到视频等。相关论文成果为 Wan: Open and Advanced Large-Scale Video Generative Models 。

本教程采用资源为单卡 A6000，生成视频大约花费 30 分钟，推荐使用更高的算力。

该工作流教程，总共使用了下列模型文件：

wan2.1_vace_14B_fp16.safetensors

wan_2.1_vae.safetensors

umt5_xxl_fp8_e4m3fn_scaled.safetensors

引用信息

感谢 Github 用户 SuperYang 对本教程的部署，本项目引用信息如下：

@article{wan2025, title={Wan: Open and Advanced Large-Scale Video Generative Models}, author={Team Wan and Ang Wang and Baole Ai and Bin Wen and Chaojie Mao and Chen-Wei Xie and Di Chen and Feiwu Yu and Haiming Zhao and Jianxiao Yang and Jianyuan Zeng and Jiayu Wang and Jingfeng Zhang and Jingren Zhou and Jinkai Wang and Jixuan Chen and Kai Zhu and Kang Zhao and Keyu Yan and Lianghua Huang and Mengyang Feng and Ningyi Zhang and Pandeng Li and Pingyu Wu and Ruihang Chu and Ruili Feng and Shiwei Zhang and Siyang Sun and Tao Fang and Tianxing Wang and Tianyi Gui and Tingyu Weng and Tong Shen and Wei Lin and Wei Wang and Wei Wang and Wenmeng Zhou and Wente Wang and Wenting Shen and Wenyuan Yu and Xianzhong Shi and Xiaoming Huang and Xin Xu and Yan Kou and Yangyu Lv and Yifei Li and Yijing Liu and Yiming Wang and Yingya Zhang and Yitong Huang and Yong Li and You Wu and Yu Liu and Yulin Pan and Yun Zheng and Yuntao Hong and Yupeng Shi and Yutong Feng and Zeyinzi Jiang and Zhen Han and Zhi-Fan Wu and Ziyu Liu}, journal = {arXiv preprint arXiv:2503.20314}, year={2025} }

HyperAI

运行此教程在 Discord 上讨论

日期

8 个月前

大小

1.47 GB

标签

文生视频

视频生成

许可证

Apache 2.0

GitHub

Wan-Video/Wan2.1

论文 URL

2503.20314

一、教程简介

本教程采用资源为单卡 A6000，生成视频大约花费 30 分钟，推荐使用更高的算力。

该工作流教程，总共使用了下列模型文件：

wan2.1_vace_14B_fp16.safetensors
wan_2.1_vae.safetensors
umt5_xxl_fp8_e4m3fn_scaled.safetensors

二、项目示例

三、运行步骤

1. 启动容器后点击 API 地址即可进入 Web 界面

若显示「Bad Gateway」，这表示模型正在初始化，由于模型较大，请等待约 1-2 分钟后刷新页面。

2. 功能演示

使用步骤

首次克隆需要手动打开文件夹内的工作流进行加载。

四、交流探讨

🖌️ 如果大家看到优质项目，欢迎后台留言推荐！另外，我们还建立了教程交流群，欢迎小伙伴们扫码备注【SD 教程】入群探讨各类技术问题、分享应用效果↓

引用信息

感谢 Github 用户 SuperYang 对本教程的部署，本项目引用信息如下：

@article{wan2025,
      title={Wan: Open and Advanced Large-Scale Video Generative Models}, 
      author={Team Wan and Ang Wang and Baole Ai and Bin Wen and Chaojie Mao and Chen-Wei Xie and Di Chen and Feiwu Yu and Haiming Zhao and Jianxiao Yang and Jianyuan Zeng and Jiayu Wang and Jingfeng Zhang and Jingren Zhou and Jinkai Wang and Jixuan Chen and Kai Zhu and Kang Zhao and Keyu Yan and Lianghua Huang and Mengyang Feng and Ningyi Zhang and Pandeng Li and Pingyu Wu and Ruihang Chu and Ruili Feng and Shiwei Zhang and Siyang Sun and Tao Fang and Tianxing Wang and Tianyi Gui and Tingyu Weng and Tong Shen and Wei Lin and Wei Wang and Wei Wang and Wenmeng Zhou and Wente Wang and Wenting Shen and Wenyuan Yu and Xianzhong Shi and Xiaoming Huang and Xin Xu and Yan Kou and Yangyu Lv and Yifei Li and Yijing Liu and Yiming Wang and Yingya Zhang and Yitong Huang and Yong Li and You Wu and Yu Liu and Yulin Pan and Yun Zheng and Yuntao Hong and Yupeng Shi and Yutong Feng and Zeyinzi Jiang and Zhen Han and Zhi-Fan Wu and Ziyu Liu},
      journal = {arXiv preprint arXiv:2503.20314},
      year={2025}
}

该教程由社区用户贡献，仅供交流学习使用。如内容涉及侵权，请联系邮箱 [email protected] 以便及时审查和下架。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

一、教程简介

本教程采用资源为单卡 A6000，生成视频大约花费 30 分钟，推荐使用更高的算力。

该工作流教程，总共使用了下列模型文件：

wan2.1_vace_14B_fp16.safetensors

wan_2.1_vae.safetensors

umt5_xxl_fp8_e4m3fn_scaled.safetensors

引用信息

感谢 Github 用户 SuperYang 对本教程的部署，本项目引用信息如下：

Command Palette

ComfyUI Wan2.1-VACE-14B 图生视频工作流教程

一、教程简介

二、项目示例

三、运行步骤

四、交流探讨

引用信息

用 AI 构建 AI

HyperAI Newsletters

Command Palette

ComfyUI Wan2.1-VACE-14B 图生视频工作流教程

一、教程简介

二、项目示例

三、运行步骤

四、交流探讨

引用信息

相关教程

LongCat-Video：美团开源的 AI 视频生成模型

Krea-realtime-video：实时视频生成模型

Open-AutoGLM：手机端智能助理

VibeVoice-Realtime TTS：实时语音合成服务

PaddleOCR-VL：多模态文档解析

MonkeyOCR：基于结构-识别-关系三元组范式的文档解析

SAM3：视觉分割模型

HunyuanOCR：腾讯混元端到端 OCR

一键部署 Ministral-3-14B-Instruct

用 AI 构建 AI

HyperAI Newsletters

Command Palette

ComfyUI Wan2.1-VACE-14B 图生视频工作流教程

一、教程简介

二、项目示例

三、运行步骤

四、交流探讨

引用信息

相关教程

LongCat-Video：美团开源的 AI 视频生成模型

Krea-realtime-video：实时视频生成模型

Open-AutoGLM：手机端智能助理

VibeVoice-Realtime TTS：实时语音合成服务

PaddleOCR-VL：多模态文档解析

MonkeyOCR：基于结构-识别-关系三元组范式的文档解析

SAM3：视觉分割模型

HunyuanOCR：腾讯混元端到端 OCR

一键部署 Ministral-3-14B-Instruct

用 AI 构建 AI

HyperAI Newsletters

相关教程

LongCat-Video：美团开源的 AI 视频生成模型

Krea-realtime-video：实时视频生成模型

Open-AutoGLM：手机端智能助理

VibeVoice-Realtime TTS：实时语音合成服务

PaddleOCR-VL：多模态文档解析

MonkeyOCR：基于结构-识别-关系三元组范式的文档解析

SAM3：视觉分割模型

HunyuanOCR：腾讯混元端到端 OCR

一键部署 Ministral-3-14B-Instruct

相关教程

LongCat-Video：美团开源的 AI 视频生成模型

Krea-realtime-video：实时视频生成模型

Open-AutoGLM：手机端智能助理

VibeVoice-Realtime TTS：实时语音合成服务

PaddleOCR-VL：多模态文档解析

MonkeyOCR：基于结构-识别-关系三元组范式的文档解析

SAM3：视觉分割模型

HunyuanOCR：腾讯混元端到端 OCR

一键部署 Ministral-3-14B-Instruct