Datum

vor einem Jahr

Größe

3.06 GB

Paper-URL

arxiv.org

Lizenz

Apache 2.0

Tags

Audio-Klassifikation

Text-to-Audio

NonverbalTTS ist ein Datensatz zur nonverbalen Audiogenerierung, der 2025 von VK Lab und Yandex veröffentlicht wurde. Die zugehörigen Ergebnisse des Papiers sind „NonverbalTTS: Ein öffentliches englisches Korpus textorientierter nonverbaler Vokalisierungen mit Emotionsannotationen für Text-to-Speech“, dessen Ziel es ist, die Forschung im Bereich ausdrucksstarker Text-to-Audio (TTS) zu fördern und Modelle zur Erzeugung natürlicher Sprache zu unterstützen, die Emotionen und nonverbale Laute enthält. Der Datensatz enthält 17 Stunden hochwertige Sprachdaten von 2.296 Teilnehmern (601 TP3T-Männer, 401 TP3T-Frauen) und deckt 10 nonverbale Sprachtypen (Atmen, Lachen, Seufzen, Niesen, Husten, Räuspern, Stöhnen, Grunzen, Schnarchen und Einatmen) und 8 Emotionskategorien (Wut, Ekel, Angst, Glück, Neutralität, Traurigkeit, Überraschung und Sonstiges) ab.

Datensatzfunktionen:

Daten aus mehreren Quellen: abgeleitet aus den Korpora von VoxCeleb und Expresso
Umfangreiche Metadaten: Emotions-Tags, nonverbale Sprachanmerkungen, Sprecher-IDs, Audioqualitätsmetriken
Abtastrate: 16 kHz für Audio von VoxCeleb, 48 kHz für Audio von Expresso

NonverbalTTS.torrent

Seeding 1Wird heruntergeladen 0Abgeschlossen 44Gesamtdownloads 152

NonverbalTTS/
- README.md
  1.77 KB
- README.txt
  3.55 KB

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Diesen Datensatz verwenden

Auf Discord diskutieren

Datum

vor einem Jahr

Größe

3.06 GB

Paper-URL

arxiv.org

Lizenz

Apache 2.0

Datensatzfunktionen:

Daten aus mehreren Quellen: abgeleitet aus den Korpora von VoxCeleb und Expresso
Umfangreiche Metadaten: Emotions-Tags, nonverbale Sprachanmerkungen, Sprecher-IDs, Audioqualitätsmetriken
Abtastrate: 16 kHz für Audio von VoxCeleb, 48 kHz für Audio von Expresso

NonverbalTTS.torrent

Seeding 1Wird heruntergeladen 0Abgeschlossen 44Gesamtdownloads 152

NonverbalTTS/
- README.md
  1.77 KB
- README.txt
  3.55 KB

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

NonverbalTTS-Datensatz Zur Nonverbalen Audiogenerierung

Datensatzfunktionen:

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

NonverbalTTS-Datensatz Zur Nonverbalen Audiogenerierung

Datensatzfunktionen:

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

NonverbalTTS-Datensatz Zur Nonverbalen Audiogenerierung

Datensatzfunktionen:

KI mit KI entwickeln

HyperAI Newsletters