GPT-SoVITS 音频合成在线 Demo
一、功能说明
只需要十分钟,用 30s~1min 的音频,就能使用 AI 克隆出你想要的声音,从环境部署到训练完成,一键式操作,十分钟就能搞定。
注意:我做的一键训练,目前只支持中文,如果想要训练日语、英语,需要开启 webui 使用。
方法是将 run.ipynb 运行代码里的 python run_all.py 改为 python webui.py
二、视频教程
https://www.bilibili.com/video/BV1WC411W79t
三、运行方法
1 、打开 run.ipynb
点击运行-> 运行所有单元格,启动程序,自动配置环境,开启服务。

2 、打开输出的 public URL

3 、根据你的音频选择数据类型

4 、点击开始训练
点击可以在前台看到运行到哪一步了,在后台也能看到日志输出


5 、打开 api 地址
当前端显示正在开启预测后

打开 API 地址:

6 、声音克隆
选择训练好的模型,然后输入文本,就可以愉快地玩耍了。

四、自定义音频
1 、找到数据集,创新新数据集

2 、上传音频数据

3 、修改配置并启动

4 、绑定了一个新的 input 地址

5 、打开工作空间
这样在右边的侧边栏里就能看到新绑定的数据集了。

6 、训练填写新绑定的地址
