Datum

vor 10 Monaten

Größe

1.46 GB

Organisation

Paper-URL

2509.03959

Lizenz

Non-Commercial

Tags

Audio- Und Sprachverarbeitung

Spracherkennung

Synthese

WenetSpeech Yue ist ein mehrdimensionales, annotiertes Sprachkorpus für die kantonesische Spracherkennung (ASR) und Text-to-Speech-Synthese (TTS), das 2025 von der Northwestern Polytechnical University, dem China Telecom Artificial Intelligence Research Institute, der Beijing Hill Shell Technology Co., Ltd. und anderen Institutionen veröffentlicht wurde. Die zugehörigen Ergebnisse der Studie sind:WenetSpeech-Yue: Ein umfangreiches kantonesisches Sprachkorpus mit mehrdimensionaler Annotation“, dessen Ziel es ist, die Lücke im Mangel an Ressourcen im kantonesischen Bereich zu schließen und die Ausbildung und Bewertung hochwertiger kantonesischer Modelle zu fördern. Der Datensatz enthält rund 21.800 Stunden kantonesischer Aufnahmen aus zehn Bereichen, darunter Geschichtenerzählen, Unterhaltung, Drama, Kultur, Vlog, Kommentare, Bildung, Podcasts, Nachrichten und mehr. Er eignet sich für das Training und die Evaluierung kantonesischer Modelle zur automatischen Spracherkennung (ASR) und Text-to-Speech-Synthese (TTS) sowie für die Verarbeitung verschiedener Bereiche und Sprechstile in realen Sprachszenarien. Er unterstützt außerdem die Überprüfung und Evaluierung domänenübergreifender Generalisierungsfähigkeiten.

Datenzusammensetzung:

Transkribierter Text: Ergebnisse der automatischen Spracherkennung;
Vertrauenswerte: wie z. B. Textvertrauen und Vertrauen in kantonesisches Pinyin;
Sprecherattribute: Geschlecht, Alter, Sprecher-ID;
Indikatoren für die Sprachqualität: wie SNR und DNSMOS;
Zeitannotation: Dauer, Zeitstempel auf Zeichenebene;
Erweiterte Metadaten: Programmname, Region, Link und Registrierungsinformationen.

WenetSpeech-Yue.torrent

Seeding 2Wird heruntergeladen 0Abgeschlossen 64Gesamtdownloads 238

WenetSpeech-Yue/
- README.md
  2.12 KB
- README.txt
  4.23 KB

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Zugehörige Datensätze

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Diesen Datensatz verwenden

Auf Discord diskutieren

Datum

vor 10 Monaten

Größe

1.46 GB

Organisation

Paper-URL

2509.03959

Lizenz

Non-Commercial

Datenzusammensetzung:

Transkribierter Text: Ergebnisse der automatischen Spracherkennung;
Vertrauenswerte: wie z. B. Textvertrauen und Vertrauen in kantonesisches Pinyin;
Sprecherattribute: Geschlecht, Alter, Sprecher-ID;
Indikatoren für die Sprachqualität: wie SNR und DNSMOS;
Zeitannotation: Dauer, Zeitstempel auf Zeichenebene;
Erweiterte Metadaten: Programmname, Region, Link und Registrierungsinformationen.

WenetSpeech-Yue.torrent

Seeding 2Wird heruntergeladen 0Abgeschlossen 64Gesamtdownloads 238

WenetSpeech-Yue/
- README.md
  2.12 KB
- README.txt
  4.23 KB

Zugehörige Datensätze

THINGS-EEG EEG-Datensatz

vor 5 Monaten

THINGS-MEG-Magnetoenzephalographie-Datensatz

vor 5 Monaten

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

vor 5 Monaten

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

vor 5 Monaten

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

vor 5 Monaten

MCD-rPPG Multi-Kamera-Fernphotoplethysmographie-Datensatz

vor 5 Monaten

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

WenetSpeech Yue Kantonesischer Korpus-Datensatz

Datenzusammensetzung:

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

WenetSpeech Yue Kantonesischer Korpus-Datensatz

Datenzusammensetzung:

Zugehörige Datensätze

THINGS-EEG EEG-Datensatz

THINGS-MEG-Magnetoenzephalographie-Datensatz

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

MCD-rPPG Multi-Kamera-Fernphotoplethysmographie-Datensatz

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

WenetSpeech Yue Kantonesischer Korpus-Datensatz

Datenzusammensetzung:

Zugehörige Datensätze

THINGS-EEG EEG-Datensatz

THINGS-MEG-Magnetoenzephalographie-Datensatz

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

MCD-rPPG Multi-Kamera-Fernphotoplethysmographie-Datensatz

KI mit KI entwickeln

HyperAI Newsletters

Zugehörige Datensätze

THINGS-EEG EEG-Datensatz

THINGS-MEG-Magnetoenzephalographie-Datensatz

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

MCD-rPPG Multi-Kamera-Fernphotoplethysmographie-Datensatz

Zugehörige Datensätze

THINGS-EEG EEG-Datensatz

THINGS-MEG-Magnetoenzephalographie-Datensatz

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

MCD-rPPG Multi-Kamera-Fernphotoplethysmographie-Datensatz