HyperAIHyperAI

Command Palette

Search for a command to run...

WenetSpeech Yue Kantonesischer Korpus-Datensatz

Datum

vor 2 Monaten

Größe

1.46 GB

Organisation

AISHELL
China Telecom
Northwestern Polytechnical University

Paper-URL

2509.03959

Lizenz

Nicht-kommerziell

WenetSpeech Yue ist ein mehrdimensionales, annotiertes Sprachkorpus für die kantonesische Spracherkennung (ASR) und Text-to-Speech-Synthese (TTS), das 2025 von der Northwestern Polytechnical University, dem China Telecom Artificial Intelligence Research Institute, der Beijing Hill Shell Technology Co., Ltd. und anderen Institutionen veröffentlicht wurde. Die zugehörigen Ergebnisse der Studie sind:WenetSpeech-Yue: Ein umfangreiches kantonesisches Sprachkorpus mit mehrdimensionaler Annotation“, dessen Ziel es ist, die Lücke im Mangel an Ressourcen im kantonesischen Bereich zu schließen und die Ausbildung und Bewertung hochwertiger kantonesischer Modelle zu fördern.

Der Datensatz enthält rund 21.800 Stunden kantonesischer Aufnahmen aus zehn Bereichen, darunter Geschichtenerzählen, Unterhaltung, Drama, Kultur, Vlog, Kommentare, Bildung, Podcasts, Nachrichten und mehr. Er eignet sich für das Training und die Evaluierung kantonesischer Modelle zur automatischen Spracherkennung (ASR) und Text-to-Speech-Synthese (TTS) sowie für die Verarbeitung verschiedener Bereiche und Sprechstile in realen Sprachszenarien. Er unterstützt außerdem die Überprüfung und Evaluierung domänenübergreifender Generalisierungsfähigkeiten.

Datenzusammensetzung:

  • Transkribierter Text: Ergebnisse der automatischen Spracherkennung;
  • Vertrauenswerte: wie z. B. Textvertrauen und Vertrauen in kantonesisches Pinyin;
  • Sprecherattribute: Geschlecht, Alter, Sprecher-ID;
  • Indikatoren für die Sprachqualität: wie SNR und DNSMOS;
  • Zeitannotation: Dauer, Zeitstempel auf Zeichenebene;
  • Erweiterte Metadaten: Programmname, Region, Link und Registrierungsinformationen.

WenetSpeech-Yue.torrent
Seeding 1Herunterladen 0Abgeschlossen 36Gesamtdownloads 76
  • WenetSpeech-Yue/
    • README.md
      2.12 KB
    • README.txt
      4.23 KB
      • data/
        • WenetSpeech-Yue.zip
          1.46 GB

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp