HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données Du Corpus Cantonais WenetSpeech Yue

Date

il y a 3 mois

Size

1.46 GB

Organization

AISHELL
China Telecom
Université polytechnique du Nord-Ouest

Paper URL

2509.03959

License

Non-Commercial

WenetSpeech Yue est un corpus vocal annoté multidimensionnel à grande échelle pour la reconnaissance vocale cantonaise (RAP) et la synthèse vocale (TTS). Il a été publié en 2025 par l'Université polytechnique Northwestern, l'Institut de recherche en intelligence artificielle de China Telecom, Beijing Hill Shell Technology Co., Ltd. et d'autres institutions. Les résultats de l'étude sont les suivants :WenetSpeech-Yue : un corpus de discours cantonais à grande échelle avec annotation multidimensionnelle", qui vise à combler le manque de ressources dans le domaine cantonais et à promouvoir la formation et l'évaluation de modèles cantonais de haute qualité.

L'ensemble de données contient environ 21 800 heures d'enregistrements cantonais, couvrant dix domaines, dont : la narration, le divertissement, le théâtre, la culture, les vlogs, les commentaires, l'éducation, les podcasts, l'actualité, etc. Il est adapté à l'entraînement et à l'évaluation des modèles de reconnaissance vocale automatique (RAP) et de synthèse vocale (TTS) cantonais, ainsi qu'au traitement de divers domaines et styles de parole dans des situations linguistiques réelles. Il permet également la vérification et l'évaluation des capacités de généralisation inter-domaines.

Composition des données :

  • Texte transcrit : Résultats de la reconnaissance automatique de la parole ;
  • Scores de confiance : tels que la confiance du texte et la confiance du pinyin cantonais ;
  • Attributs du locuteur : sexe, âge, identifiant du locuteur ;
  • Indicateurs de qualité vocale : tels que SNR et DNSMOS ;
  • Annotation temporelle : durée, horodatage au niveau du caractère ;
  • Métadonnées étendues : nom du programme, région, lien et informations d'inscription.

WenetSpeech-Yue.torrent
Seeding 1Downloading 0Completed 47Total Downloads 150
  • WenetSpeech-Yue/
    • README.md
      2.12 KB
    • README.txt
      4.23 KB
      • data/
        • WenetSpeech-Yue.zip
          1.46 GB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp