GPT-SoVITS 音频合成在线 Demo

一、功能说明

只需要十分钟,用 30s~1min 的音频,就能使用 AI 克隆出你想要的声音,从环境部署到训练完成,一键式操作,十分钟就能搞定。

注意:我做的一键训练,目前只支持中文,如果想要训练日语、英语,需要开启 webui 使用。

方法是将 run.ipynb 运行代码里的 python run_all.py 改为 python webui.py

二、视频教程

https://www.bilibili.com/video/BV1WC411W79t

三、运行方法

1 、打开 run.ipynb

点击运行-> 运行所有单元格,启动程序,自动配置环境,开启服务。

2 、打开输出的 public URL

3 、根据你的音频选择数据类型

4 、点击开始训练

点击可以在前台看到运行到哪一步了,在后台也能看到日志输出

5 、打开 api 地址

当前端显示正在开启预测后

打开 API 地址:

6 、声音克隆

选择训练好的模型,然后输入文本,就可以愉快地玩耍了。

四、自定义音频

1 、找到数据集,创新新数据集

2 、上传音频数据

3 、修改配置并启动

4 、绑定了一个新的 input 地址

5 、打开工作空间

这样在右边的侧边栏里就能看到新绑定的数据集了。

6 、训练填写新绑定的地址