GPT-SoVITS オーディオ合成オンライン デモ
1. 機能説明
30秒から1分の音声を使ってAIを使って必要なサウンドをクローンする作業は、環境導入からトレーニング完了までワンクリック操作で10分で完了します。
注: 私が行ったワンクリック トレーニングは現在中国語のみをサポートしています。日本語または英語をトレーニングしたい場合は、webui を有効にする必要があります。
方法は、run.ipynb 実行コード内の python run_all.py を python webui.py に変更することです。
2.ビデオチュートリアル
https://www.bilibili.com/video/BV1WC411W79t
3. 操作方法
1. run.ipynbを開きます
[実行] -> [すべてのセルを実行] をクリックし、プログラムを起動し、環境を自動的に構成してサービスを開始します。

2. 出力されたパブリック URL を開きます

3. オーディオに応じてデータの種類を選択します

4. クリックしてトレーニングを開始します
クリックすると、操作がどのステップに到達したかをフォアグラウンドで確認でき、バックグラウンドでログ出力も確認できます。


5.APIアドレスを開きます
フロントエンドが予測がオンになっていることを示した後

オープンAPIアドレス:

6. サウンドのクローン作成
トレーニング済みのモデルを選択し、テキストを入力して、楽しくプレイしてください。

4. カスタムオーディオ
1. データセットを見つけて新しいデータセットを革新する

2. 音声データをアップロードする

3. 設定を変更して開始します

4. 新しい入力アドレスがバインドされます

5. ワークスペースを開く
このようにして、右側のサイドバーに新しくバインドされたデータ セットが表示されます。

6. 新たに製本されたアドレスを記入するトレーニング
