Datum

vor 8 Monaten

Größe

389.35 GB

Organisation

Paper-URL

2502.05674

Lizenz

Apache 2.0

Tags

Text-to-Speech

Audio- Und Sprachverarbeitung

Spracherkennung

Synthese

ShiftySpeech ist ein umfangreicher Benchmark für die Erkennung synthetischer Sprache, der 2025 von der Johns Hopkins University veröffentlicht wurde. Die zugehörige Veröffentlichung trägt den Titel „ShiftySpeech: Ein umfangreicher Datensatz synthetischer Sprache mit VerteilungsverschiebungenZiel der Studie ist es, die Generalisierungsfähigkeit von Sprachsynthese-Erkennungsmodellen in der realen Welt zu untersuchen, wenn sie mit einer „Verteilungsdrift“ (einschließlich Änderungen in Sprache, Sprecher, Generierungsmodell und Aufnahmebedingungen) konfrontiert werden. Dieser Datensatz umfasst über 3.000 Stunden synthetische Sprache aus sieben verschiedenen Quellenbereichen, darunter Lesestile, Podcasts, YouTube-Aufnahmen und andere Szenarien mit Hintergrundgeräuschen oder nicht standardisierten Aufnahmebedingungen sowie Variationen in Sprache, Sprecheralter, Akzent und Geschlecht. Die Daten decken drei Sprachen ab (Englisch, Chinesisch und Japanisch). Die Sprachgenerierung erfolgte mithilfe von sechs TTS-Systemen (Text-to-Speech) und zwölf Vocodern (Vocoder/Wellenformgeneratoren), um unterschiedliche Grade an Systemverteilungsdrift zu erzeugen.

ShiftySpeech.torrent

Seeding 1Wird heruntergeladen 0Abgeschlossen 2Gesamtdownloads 94

ShiftySpeech/
- README.md
  1.6 KB
- README.txt
  3.2 KB

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Zugehörige Datensätze

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Diesen Datensatz verwenden

Auf Discord diskutieren

Datum

vor 8 Monaten

Größe

389.35 GB

Organisation

Paper-URL

2502.05674

Lizenz

Apache 2.0

Zugehörige Datensätze

Groundsource Global Flood Events Dataset

vor 3 Monaten

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

vor 4 Monaten

THINGS-EEG EEG-Datensatz

vor 5 Monaten

THINGS-MEG-Magnetoenzephalographie-Datensatz

vor 5 Monaten

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

vor 5 Monaten

RubricHub_v1 Multi-Domain Generative Task Dataset

vor 5 Monaten

Datensatz Zur Röntgen-Schmuggelware-Erkennung

vor 6 Monaten

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

ShiftySpeech-Datensatz Zur Evaluierung Der Sprachverteilung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

ShiftySpeech-Datensatz Zur Evaluierung Der Sprachverteilung

Zugehörige Datensätze

Groundsource Global Flood Events Dataset

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

THINGS-EEG EEG-Datensatz

THINGS-MEG-Magnetoenzephalographie-Datensatz

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

RubricHub_v1 Multi-Domain Generative Task Dataset

Datensatz Zur Röntgen-Schmuggelware-Erkennung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

ShiftySpeech-Datensatz Zur Evaluierung Der Sprachverteilung

Zugehörige Datensätze

Groundsource Global Flood Events Dataset

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

THINGS-EEG EEG-Datensatz

THINGS-MEG-Magnetoenzephalographie-Datensatz

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

RubricHub_v1 Multi-Domain Generative Task Dataset

Datensatz Zur Röntgen-Schmuggelware-Erkennung

KI mit KI entwickeln

HyperAI Newsletters

Zugehörige Datensätze

Groundsource Global Flood Events Dataset

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

THINGS-EEG EEG-Datensatz

THINGS-MEG-Magnetoenzephalographie-Datensatz

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

RubricHub_v1 Multi-Domain Generative Task Dataset

Datensatz Zur Röntgen-Schmuggelware-Erkennung

Zugehörige Datensätze

Groundsource Global Flood Events Dataset

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

THINGS-EEG EEG-Datensatz

THINGS-MEG-Magnetoenzephalographie-Datensatz

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

RubricHub_v1 Multi-Domain Generative Task Dataset

Datensatz Zur Röntgen-Schmuggelware-Erkennung