HyperAI

Ein-Klick-Bereitstellung Von Parler-TTS

Einführung in das Tutorial

Parler-TTS ist ein leichtes Text-to-Speech-Modell (TTS), das hochwertige, natürliche Sprache im Stil eines bestimmten Sprechers erzeugen kann. Es verfügt über ein hohes Maß an Freiheit und Innovation und kann über Prompt das Geschlecht, die Klangfarbe, die Intonation und die Szene (drinnen, draußen, unterwegs, in einem Konzertsaal usw.) des Sprechers steuern. Es handelt sich um die erste Arbeit von Stability AI und Dan Lyth und Simon King von der Universität Edinburgh mit dem Titel Natürlicher Sprachführer mit hochpräziser Text-to-Speech-Funktion und synthetischen Kommentaren„Reproduzieren Sie den Code.

Im Gegensatz zu anderen TTS-Modellen ist Parler-TTS vollständig Open Source. Alle Datensätze, Vorverarbeitungen, Trainingscodes und Gewichte werden unter einer Lizenz öffentlich freigegeben, sodass die Community auf der Arbeit dieses Tutorials aufbauen kann, um ihre eigenen leistungsstarken TTS-Modelle zu entwickeln. Hinweis: Dieses Modell unterstützt noch kein Chinesisch

Schritte ausführen

1. 克隆并启动容器,等待约 30s(加载模型),点击 API 地址即可进入 Web 界面(使用 RTX 4090 即可启动)
2. 输入要生成的文字和风格描述,点击提交即可生成

• Eingabetext: der Text, der in Sprache umgewandelt werden muss

• Beschreibung: Beschreibung der Audiorolle, Szene, Ton, Klangfarbe und andere Informationen, ähnlich wie bei Prompt. Beispiel: Die Stimme eines Mannes spricht etwas langsam vor einem sehr lauten Hintergrund, hat einen tiefen Ton und zeigt einen Hauch von Ausdruckskraft und Lebhaftigkeit. Der Klang ist sehr distanziert und verleiht ihm eine faszinierende Atmosphäre.

• Parler-TTS-Generierung: Generierte Audiodateien (können angehört und heruntergeladen werden)

Austausch und Diskussion

🖌️ Wenn Sie ein hochwertiges Projekt sehen, hinterlassen Sie bitte im Hintergrund eine Nachricht, um es weiterzuempfehlen! Darüber hinaus haben wir auch eine Tutorien-Austauschgruppe ins Leben gerufen. Willkommen, Freunde, scannen Sie den QR-Code und kommentieren Sie [SD-Tutorial], um der Gruppe beizutreten, verschiedene technische Probleme zu besprechen und Anwendungsergebnisse auszutauschen ↓