HyperAI

GPT-SoVITS Audiosynthese Online-Demo

1. Funktionsbeschreibung

Es dauert nur zehn Minuten, und Sie können mithilfe von KI und 30 bis 1 Minute Audio den gewünschten Sound klonen. Von der Bereitstellung der Umgebung bis zum Abschluss der Schulung ist alles mit nur einem Klick erledigt und kann in zehn Minuten erledigt werden.

Hinweis: Das von mir erstellte One-Click-Training unterstützt derzeit nur Chinesisch. Wenn Sie Japanisch oder Englisch trainieren möchten, müssen Sie die WebUI aktivieren.

Die Methode besteht darin, Python run_all.py im laufenden Code run.ipynb in Python webui.py zu ändern.

2. Video-Tutorial

https://www.bilibili.com/video/BV1WC411W79t

3. Funktionsweise

1. Öffnen Sie run.ipynb

Klicken Sie auf „Ausführen“ -> „Alle Zellen ausführen“, um das Programm zu starten, die Umgebung automatisch zu konfigurieren und den Dienst zu starten.

2. Öffnen Sie die öffentliche Ausgabe-URL

3. Wählen Sie den Datentyp entsprechend Ihrer Audio

4. Klicken Sie hier, um mit dem Training zu beginnen

Klicken Sie, um zu sehen, welchen Schritt der Prozess im Vordergrund erreicht hat. Außerdem können Sie die Protokollausgabe im Hintergrund sehen.

5. Öffnen Sie die API-Adresse

Wenn das Frontend anzeigt, dass die Vorhersage aktiviert ist

Offene API-Adresse:

6. Stimmenklonen

Wählen Sie das trainierte Modell aus, geben Sie Ihren Text ein und haben Sie Spaß.

4. Benutzerdefiniertes Audio

1. Datensätze finden und neue Datensätze erstellen

2. Audiodaten hochladen

3. Ändern Sie die Konfiguration und starten Sie

4. Binden Sie eine neue Eingabeadresse

5. Öffnen Sie den Arbeitsbereich

Auf diese Weise können Sie den neu gebundenen Datensatz in der Seitenleiste rechts sehen.

6. Training zum Ausfüllen der neu gebundenen Adresse