HyperAI超神经

EvoSearch-codes:进化算法框架

一、教程简介

GitHub Stars

EvoSearch-codes 是由香港科技大学和快手可灵团队于 2025 年 5 月 1 日推出 Evolutionary Search 方法。通过提高推理时的计算量来大幅提升模型的生成质量,支持图像和视频生成,支持目前最先进的 diffusion-based 和 flow-based 模型。 EvoSearch 无需训练,无需梯度更新,即可在一系列任务上取得显著最优效果,并且表现出良好的 scaling up 能力,鲁棒性和泛化性。随着测试时计算量提升,EvoSearch 表明 SD2.1 和 Flux.1-dev 也有潜力媲美甚至超过 GPT-4o 。对于视频生成,Wan 1.3B 也能超过 Wan 14B 和 Hunyuan 13B,展现了 test-time scaling 补充 training-time scaling 的潜力和研究空间。相关论文成果为「Scaling Image and Video Generation via Test-Time Evolutionary Search」。

本教程采用资源为单卡 RTX A6000 。本教材提供 Wan Video Generation 、 SD Image Generation 和 FLUX Image Generation 三个示例供测试。

二、项目示例

三、运行步骤

1. 启动容器后点击 API 地址即可进入 Web 界面

2. 使用步骤

若显示「Bad Gateway」,这表示模型正在初始化,由于模型较大,请等待约 2-3 分钟后刷新页面。

2.1 Wan Video Generation

提示:生成视频大约需要 5 – 8 分钟。

参数说明

  • Advanced Settings
    • Random Seed:随机种子。
    • Height:视频生成高度。
    • Width:视频生成宽度。
    • Video duration:控制视频时长。
    • Inference Steps:推理步骤。
    • Guidance Scale:控制文本提示对生成视频的影响强度。
    • Iteration:迭代次数。

2.2 SD Image Generation

提示:提示词使用英文效果更好。

  • Advanced Settings
    • Random Seed:随机种子。
    • Image Size:图像大小。
    • Inference Steps:推理步骤。
    • CFG Scale:控制文本提示对生成图像的影响强度。
    • Iteration:迭代次数。

2.3 FLUX Image Generation

四、交流探讨

🖌️ 如果大家看到优质项目,欢迎后台留言推荐!另外,我们还建立了教程交流群,欢迎小伙伴们扫码备注【SD 教程】入群探讨各类技术问题、分享应用效果↓

引用信息

本项目引用信息如下:

@misc{he2025scaling,
    title={Scaling Image and Video Generation via Test-Time Evolutionary Search},
    author={Haoran He and Jiajun Liang and Xintao Wang and Pengfei Wan and Di Zhang and Kun Gai and Ling Pan},
    year={2025},
    eprint={2505.17618},
    archivePrefix={arXiv},
    primaryClass={cs.CV}
}