只需要十分钟,用 30s~1min 的音频,就能使用 AI 克隆出你想要的声音,从环境部署到训练完成,一键式操作,十分钟就能搞定。
注意:我做的一键训练,目前只支持中文,如果想要训练日语、英语,需要开启 webui 使用。
方法是将 run.ipynb 运行代码里的 python run_all.py 改为 python webui.py
https://www.bilibili.com/video/BV1WC411W79t
1 、打开 run.ipynb
点击运行-> 运行所有单元格,启动程序,自动配置环境,开启服务。
2 、打开输出的 public URL
3 、根据你的音频选择数据类型
4 、点击开始训练
点击可以在前台看到运行到哪一步了,在后台也能看到日志输出
5 、打开 api 地址
当前端显示正在开启预测后
打开 API 地址:
6 、声音克隆
选择训练好的模型,然后输入文本,就可以愉快地玩耍了。
1 、找到数据集,创新新数据集
2 、上传音频数据
3 、修改配置并启动
4 、绑定了一个新的 input 地址
5 、打开工作空间
这样在右边的侧边栏里就能看到新绑定的数据集了。
6 、训练填写新绑定的地址