Hunyuan-GameCraft-1.0:交互式游戏视频生成框架

一、教程简介

Build

Hunyuan-GameCraft-1.0 是由腾讯 Hunyuan 团队和华中科技大学于 2025 年 8 月共同推出的高动态交互式游戏视频生成框架。基于将键盘和鼠标输入统一到共享的相机表示空间,实现精细的动作控制,支持复杂的交互输入。框架推出混合历史条件训练策略,能自回归地扩展视频序列,保留游戏场景信息,确保长期的时间连贯性。基于模型蒸馏技术,Hunyuan-GameCraft-1.0 显著提高推理速度,适合在复杂交互环境中实时部署。模型在大规模 AAA 游戏数据集上进行训练,展现出卓越的视觉保真度、真实性和动作可控性,显著优于现有模型。相关论文成果为「Hunyuan-GameCraft: High-dynamic Interactive Game Video Generation with Hybrid History Condition」。

该教程算力资源采用四卡 RTX 4090 。

二、效果展示

三、运行步骤

1. 启动容器

2. 使用步骤

若显示「Bad Gateway」,这表示模型正在初始化,由于模型较大,请等待约 5-6 分钟后刷新页面,并确保模型初始化完成后操作 Gradio 界面。

注意:推理步数/视频帧数越多,生成的效果越好,同时推理生成时间也会更长,请合理设置推理步数/视频帧数(推理步骤为 5 , 视频帧数为 33 时,生成视频大约需要 15 分钟左右)。

具体参数:

  • Select Actions(Action List):
    • forward:沿当前朝向(相机/载体的正前方)直线向前移动,不改变朝向。
    • left:沿当前朝向的「左侧」横向平移,不改变朝向。
    • right:沿当前朝向的「右侧」横向平移,不改变朝向。
    • backward:沿当前朝向的反方向直线向后移动,不改变朝向。
    • up_rot:绕「水平轴」向上旋转视角/俯仰角(pitch ↑),只改变视角方向,不改变位置。
    • right_rot:绕「竖直轴」向右旋转视角(yaw →),只改变朝向,不改变位置。
    • left_rot:绕「竖直轴」向左旋转视角(yaw ←),只改变朝向,不改变位置。
    • down_rot:绕「水平轴」向下旋转视角/俯仰角(pitch ↓),只改变视角方向,不改变位置。
  • CFG Scale:控制提示词对生成结果的影响程度,值越大越贴合提示词。
  • Sample N Frames:生成视频的总帧数。
  • Inference Steps:视频生成的迭代优化步数。
  • Flow Shift Eval Video:控制视频流畅度的参数。

四、交流探讨

🖌️ 如果大家看到优质项目,欢迎后台留言推荐!另外,我们还建立了教程交流群,欢迎小伙伴们扫码备注【SD 教程】入群探讨各类技术问题、分享应用效果↓

引用信息

感谢 Github 用户 SuperYang  对本教程的部署。本项目引用信息如下:

@misc{li2025hunyuangamecrafthighdynamicinteractivegame,
    title={Hunyuan-GameCraft: High-dynamic Interactive Game Video Generation with Hybrid History Condition}, 
    author={Jiaqi Li and Junshu Tang and Zhiyong Xu and Longhuang Wu and Yuan Zhou and Shuai Shao and Tianbao Yu and Zhiguo Cao and Qinglin Lu},
    year={2025},
    eprint={2506.17201},
    archivePrefix={arXiv},
    primaryClass={cs.CV},
    url={https://arxiv.org/abs/2506.17201}, 
}