1. Einführung in das Tutorial

NeuTTS-Air ist ein End-to-End-Sprachsynthesemodell (TTS), das im Oktober 2025 von Neuphonic veröffentlicht wurde. Basierend auf dem 0,5B Qwen LLM-Backbone und dem NeuCodec-Audiocodec zeigt es Few-Shot-Learning-Fähigkeiten bei der On-Device-Bereitstellung und sofortigem Voice-Cloning. Die Systembewertung zeigt, dass NeuTTS Air das SOTA-Niveau unter den Open-Source-Modellen erreicht hat, insbesondere bei Benchmarks für ultrarealistische Synthese und Echtzeit-Inferenz. Es lässt sich auch auf neue Szenarien wie eingebettete Agenten und Stilübertragung generalisieren, unterstützt 3-Sekunden-Audio-Cloning und generiert natürliche Gesprächsinhalte. Nach dem Training werden GGML/ONNX-Unterstützung und ein Wasserzeichenmechanismus eingeführt, was im Open-Source-Bereich bei der On-Device-TTS- und Leistungsoptimierungsbewertung führend ist und in einigen Szenarien mit Closed-Source-Modellen vergleichbar ist.

Dieses Tutorial verwendet eine einzelne RTX 5090-Karte als Ressource und das Modell unterstützt nur Englisch.

3. Bedienungsschritte

1. Klicken Sie nach dem Starten des Containers auf die API-Adresse, um die Weboberfläche aufzurufen

2. Sobald Sie die Webseite betreten, können Sie das Modell verwenden

Wenn „Bad Gateway“ angezeigt wird, bedeutet dies, dass der Code im Hintergrund ausgeführt wird. Bitte warten Sie etwa 2-3 Minuten und aktualisieren Sie die Seite.

Bei Verwendung des Safari-Browsers wird der Ton möglicherweise nicht direkt abgespielt und muss vor der Wiedergabe heruntergeladen werden.

Anwendung

HyperAI

Dieses Notebook ausführen Auf Discord diskutieren

Datum

vor 3 Monaten

Größe

616.92 KB

1. Einführung in das Tutorial

Dieses Tutorial verwendet eine einzelne RTX 5090-Karte als Ressource und das Modell unterstützt nur Englisch.

2. Projektbeispiele

3. Bedienungsschritte

1. Klicken Sie nach dem Starten des Containers auf die API-Adresse, um die Weboberfläche aufzurufen

2. Sobald Sie die Webseite betreten, können Sie das Modell verwenden

Wenn „Bad Gateway“ angezeigt wird, bedeutet dies, dass der Code im Hintergrund ausgeführt wird. Bitte warten Sie etwa 2-3 Minuten und aktualisieren Sie die Seite.

Bei Verwendung des Safari-Browsers wird der Ton möglicherweise nicht direkt abgespielt und muss vor der Wiedergabe heruntergeladen werden.

Anwendung

Dieses Notebook wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Bei urheberrechtlichen Bedenken kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Verwandt Notebooks

Supertonic: Ein Auf ONNX Basierendes Hochgeschwindigkeits-TTS-Sprachsynthesemodell.

vor 2 Monaten

SoulX-Podcast: Generierung Von Langtexten in Podcast-Qualität Für Verschiedene Dialekte.

vor 2 Monaten

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Dieses Notebook ausführen Auf Discord diskutieren

Datum

vor 3 Monaten

Größe

616.92 KB

1. Einführung in das Tutorial

Dieses Tutorial verwendet eine einzelne RTX 5090-Karte als Ressource und das Modell unterstützt nur Englisch.

2. Projektbeispiele

3. Bedienungsschritte

1. Klicken Sie nach dem Starten des Containers auf die API-Adresse, um die Weboberfläche aufzurufen

2. Sobald Sie die Webseite betreten, können Sie das Modell verwenden

Wenn „Bad Gateway“ angezeigt wird, bedeutet dies, dass der Code im Hintergrund ausgeführt wird. Bitte warten Sie etwa 2-3 Minuten und aktualisieren Sie die Seite.

Bei Verwendung des Safari-Browsers wird der Ton möglicherweise nicht direkt abgespielt und muss vor der Wiedergabe heruntergeladen werden.

Anwendung

Verwandt Notebooks

F5-E2 TTS Klont Jeden Ton in Nur 3 Sekunden

vor 2 Monaten

Open-AutoGLM: Intelligenter Assistent Für Mobile Geräte

vor 2 Monaten

kyutai-tts-1.6 b-en_fr Audio Generation

vor einem Monat

Qwen-Image-Lightning Mit Einem Klick Bereitstellen

vor 2 Monaten

Dia2-TTS: Echtzeit-Sprachsynthesedienst

vor 2 Monaten

VibeVoice-Realtime TTS: Echtzeit-Sprachsynthesedienst

vor 2 Monaten

Ein-Klick-Bereitstellung Von DeepSeek-R1-70B

vor 3 Monaten

Supertonic: Ein Auf ONNX Basierendes Hochgeschwindigkeits-TTS-Sprachsynthesemodell.

vor 2 Monaten

SoulX-Podcast: Generierung Von Langtexten in Podcast-Qualität Für Verschiedene Dialekte.

vor 2 Monaten

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

NeuTTS-Air: Ein Leichtes Und Effizientes Modell Zum Klonen Von Stimmen

1. Einführung in das Tutorial

2. Projektbeispiele

3. Bedienungsschritte

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

NeuTTS-Air: Ein Leichtes Und Effizientes Modell Zum Klonen Von Stimmen

1. Einführung in das Tutorial

2. Projektbeispiele

3. Bedienungsschritte

Verwandt Notebooks

F5-E2 TTS Klont Jeden Ton in Nur 3 Sekunden

Open-AutoGLM: Intelligenter Assistent Für Mobile Geräte

kyutai-tts-1.6 b-en_fr Audio Generation

Qwen-Image-Lightning Mit Einem Klick Bereitstellen

Dia2-TTS: Echtzeit-Sprachsynthesedienst

VibeVoice-Realtime TTS: Echtzeit-Sprachsynthesedienst

Ein-Klick-Bereitstellung Von DeepSeek-R1-70B

Supertonic: Ein Auf ONNX Basierendes Hochgeschwindigkeits-TTS-Sprachsynthesemodell.

SoulX-Podcast: Generierung Von Langtexten in Podcast-Qualität Für Verschiedene Dialekte.

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

NeuTTS-Air: Ein Leichtes Und Effizientes Modell Zum Klonen Von Stimmen

1. Einführung in das Tutorial

2. Projektbeispiele

3. Bedienungsschritte

Verwandt Notebooks

F5-E2 TTS Klont Jeden Ton in Nur 3 Sekunden

Open-AutoGLM: Intelligenter Assistent Für Mobile Geräte

kyutai-tts-1.6 b-en_fr Audio Generation

Qwen-Image-Lightning Mit Einem Klick Bereitstellen

Dia2-TTS: Echtzeit-Sprachsynthesedienst

VibeVoice-Realtime TTS: Echtzeit-Sprachsynthesedienst

Ein-Klick-Bereitstellung Von DeepSeek-R1-70B

Supertonic: Ein Auf ONNX Basierendes Hochgeschwindigkeits-TTS-Sprachsynthesemodell.

SoulX-Podcast: Generierung Von Langtexten in Podcast-Qualität Für Verschiedene Dialekte.

KI mit KI entwickeln

HyperAI Newsletters

Verwandt Notebooks

F5-E2 TTS Klont Jeden Ton in Nur 3 Sekunden

Open-AutoGLM: Intelligenter Assistent Für Mobile Geräte

kyutai-tts-1.6 b-en_fr Audio Generation

Qwen-Image-Lightning Mit Einem Klick Bereitstellen

Dia2-TTS: Echtzeit-Sprachsynthesedienst

VibeVoice-Realtime TTS: Echtzeit-Sprachsynthesedienst

Ein-Klick-Bereitstellung Von DeepSeek-R1-70B

Supertonic: Ein Auf ONNX Basierendes Hochgeschwindigkeits-TTS-Sprachsynthesemodell.

SoulX-Podcast: Generierung Von Langtexten in Podcast-Qualität Für Verschiedene Dialekte.

Verwandt Notebooks

F5-E2 TTS Klont Jeden Ton in Nur 3 Sekunden

Open-AutoGLM: Intelligenter Assistent Für Mobile Geräte

kyutai-tts-1.6 b-en_fr Audio Generation

Qwen-Image-Lightning Mit Einem Klick Bereitstellen

Dia2-TTS: Echtzeit-Sprachsynthesedienst

VibeVoice-Realtime TTS: Echtzeit-Sprachsynthesedienst

Ein-Klick-Bereitstellung Von DeepSeek-R1-70B

Supertonic: Ein Auf ONNX Basierendes Hochgeschwindigkeits-TTS-Sprachsynthesemodell.

SoulX-Podcast: Generierung Von Langtexten in Podcast-Qualität Für Verschiedene Dialekte.