3. Bedienungsschritte

1. Klicken Sie nach dem Starten des Containers auf die API-Adresse, um die Weboberfläche aufzurufen

2. Anwendungsschritte

Wenn „Bad Gateway“ angezeigt wird, bedeutet dies, dass das Modell initialisiert wird. Da das Modell groß ist, warten Sie bitte etwa 2–3 Minuten und aktualisieren Sie die Seite. Bei Verwendung des Safari-Browsers wird der Ton möglicherweise nicht direkt abgespielt und muss vor der Wiedergabe heruntergeladen werden.

*In diesem Tutorial können Sie im „Audioeingabemodus“ zwischen der Audiogenerierung für einen Einzelspieler (Single) und der Audiogenerierung für Dialoge für zwei Spieler (Rolle) wählen.

HyperAI

Dieses Notebook ausführen Auf Discord diskutieren

Datum

vor 2 Monaten

Größe

8.4 MB

1. Einführung in das Tutorial

Dieses Tutorial verwendet eine einzelne RTX 5090-Karte als Ressource.

2. Projektbeispiele

3. Bedienungsschritte

1. Klicken Sie nach dem Starten des Containers auf die API-Adresse, um die Weboberfläche aufzurufen

2. Anwendungsschritte

Wenn „Bad Gateway“ angezeigt wird, bedeutet dies, dass das Modell initialisiert wird. Da das Modell groß ist, warten Sie bitte etwa 2–3 Minuten und aktualisieren Sie die Seite. Bei Verwendung des Safari-Browsers wird der Ton möglicherweise nicht direkt abgespielt und muss vor der Wiedergabe heruntergeladen werden.

*In diesem Tutorial können Sie im „Audioeingabemodus“ zwischen der Audiogenerierung für einen Einzelspieler (Single) und der Audiogenerierung für Dialoge für zwei Spieler (Rolle) wählen.

Zitationsinformationen

Die Zitationsinformationen für dieses Projekt lauten wie folgt:

@article{moss2025ttsd,
  title={Text to Spoken Dialogue Generation}, 
  author={OpenMOSS Team},
  year={2025}
}

Dieses Notebook wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Bei urheberrechtlichen Bedenken kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Verwandt Notebooks

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Dieses Notebook ausführen Auf Discord diskutieren

Datum

vor 2 Monaten

Größe

8.4 MB

1. Einführung in das Tutorial

Dieses Tutorial verwendet eine einzelne RTX 5090-Karte als Ressource.

2. Projektbeispiele

3. Bedienungsschritte

1. Klicken Sie nach dem Starten des Containers auf die API-Adresse, um die Weboberfläche aufzurufen

2. Anwendungsschritte

Wenn „Bad Gateway“ angezeigt wird, bedeutet dies, dass das Modell initialisiert wird. Da das Modell groß ist, warten Sie bitte etwa 2–3 Minuten und aktualisieren Sie die Seite. Bei Verwendung des Safari-Browsers wird der Ton möglicherweise nicht direkt abgespielt und muss vor der Wiedergabe heruntergeladen werden.

*In diesem Tutorial können Sie im „Audioeingabemodus“ zwischen der Audiogenerierung für einen Einzelspieler (Single) und der Audiogenerierung für Dialoge für zwei Spieler (Rolle) wählen.

Zitationsinformationen

Die Zitationsinformationen für dieses Projekt lauten wie folgt:

@article{moss2025ttsd,
  title={Text to Spoken Dialogue Generation}, 
  author={OpenMOSS Team},
  year={2025}
}

Verwandt Notebooks

Krea-realtime-video: Echtzeit-Videogenerierungsmodell

vor 3 Monaten

F5-E2 TTS Klont Jeden Ton in Nur 3 Sekunden

vor 2 Monaten

ROCKET-2: 3D-Spiel Zero-Shot-Transfer

vor 2 Monaten

MAGE: Monoklonaler Antikörper-Gengenerator

vor 2 Monaten

Ein-Klick-Bereitstellung Von Ministry-3-14B-Instruct

vor 2 Monaten

LongCat-Image: Ein Zweisprachiges Textgesteuertes Bildgenerierungssystem

vor 2 Monaten

OCRFlux-3B: Intelligentes Texterkennungs-Toolkit

vor 3 Monaten

JarvisArt-Vorschau Intelligenter Fotoretusche-Proxy

vor einem Monat

kyutai-tts-1.6 b-en_fr Audio Generation

vor einem Monat

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

MOSS: Text-to-Spoken-Dialoggenerierung

1. Einführung in das Tutorial

2. Projektbeispiele

3. Bedienungsschritte

Zitationsinformationen

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

MOSS: Text-to-Spoken-Dialoggenerierung

1. Einführung in das Tutorial

2. Projektbeispiele

3. Bedienungsschritte

Zitationsinformationen

Verwandt Notebooks

Krea-realtime-video: Echtzeit-Videogenerierungsmodell

F5-E2 TTS Klont Jeden Ton in Nur 3 Sekunden

ROCKET-2: 3D-Spiel Zero-Shot-Transfer

MAGE: Monoklonaler Antikörper-Gengenerator

Ein-Klick-Bereitstellung Von Ministry-3-14B-Instruct

LongCat-Image: Ein Zweisprachiges Textgesteuertes Bildgenerierungssystem

OCRFlux-3B: Intelligentes Texterkennungs-Toolkit

JarvisArt-Vorschau Intelligenter Fotoretusche-Proxy

kyutai-tts-1.6 b-en_fr Audio Generation

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

MOSS: Text-to-Spoken-Dialoggenerierung

1. Einführung in das Tutorial

2. Projektbeispiele

3. Bedienungsschritte

Zitationsinformationen

Verwandt Notebooks

Krea-realtime-video: Echtzeit-Videogenerierungsmodell

F5-E2 TTS Klont Jeden Ton in Nur 3 Sekunden

ROCKET-2: 3D-Spiel Zero-Shot-Transfer

MAGE: Monoklonaler Antikörper-Gengenerator

Ein-Klick-Bereitstellung Von Ministry-3-14B-Instruct

LongCat-Image: Ein Zweisprachiges Textgesteuertes Bildgenerierungssystem

OCRFlux-3B: Intelligentes Texterkennungs-Toolkit

JarvisArt-Vorschau Intelligenter Fotoretusche-Proxy

kyutai-tts-1.6 b-en_fr Audio Generation

KI mit KI entwickeln

HyperAI Newsletters

Verwandt Notebooks

Krea-realtime-video: Echtzeit-Videogenerierungsmodell

F5-E2 TTS Klont Jeden Ton in Nur 3 Sekunden

ROCKET-2: 3D-Spiel Zero-Shot-Transfer

MAGE: Monoklonaler Antikörper-Gengenerator

Ein-Klick-Bereitstellung Von Ministry-3-14B-Instruct

LongCat-Image: Ein Zweisprachiges Textgesteuertes Bildgenerierungssystem

OCRFlux-3B: Intelligentes Texterkennungs-Toolkit

JarvisArt-Vorschau Intelligenter Fotoretusche-Proxy

kyutai-tts-1.6 b-en_fr Audio Generation

Verwandt Notebooks

Krea-realtime-video: Echtzeit-Videogenerierungsmodell

F5-E2 TTS Klont Jeden Ton in Nur 3 Sekunden

ROCKET-2: 3D-Spiel Zero-Shot-Transfer

MAGE: Monoklonaler Antikörper-Gengenerator

Ein-Klick-Bereitstellung Von Ministry-3-14B-Instruct

LongCat-Image: Ein Zweisprachiges Textgesteuertes Bildgenerierungssystem

OCRFlux-3B: Intelligentes Texterkennungs-Toolkit

JarvisArt-Vorschau Intelligenter Fotoretusche-Proxy

kyutai-tts-1.6 b-en_fr Audio Generation