HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données Du Corpus Cantonais WenetSpeech Yue

Date

il y a 2 mois

Taille

1.46 GB

Organisation

AISHELL
China Telecom
Université polytechnique du Nord-Ouest

URL de l'article

2509.03959

Licence

Non-Commercial

WenetSpeech Yue est un corpus vocal annoté multidimensionnel à grande échelle pour la reconnaissance vocale cantonaise (RAP) et la synthèse vocale (TTS). Il a été publié en 2025 par l'Université polytechnique Northwestern, l'Institut de recherche en intelligence artificielle de China Telecom, Beijing Hill Shell Technology Co., Ltd. et d'autres institutions. Les résultats de l'étude sont les suivants :WenetSpeech-Yue : un corpus de discours cantonais à grande échelle avec annotation multidimensionnelle", qui vise à combler le manque de ressources dans le domaine cantonais et à promouvoir la formation et l'évaluation de modèles cantonais de haute qualité.

L'ensemble de données contient environ 21 800 heures d'enregistrements cantonais, couvrant dix domaines, dont : la narration, le divertissement, le théâtre, la culture, les vlogs, les commentaires, l'éducation, les podcasts, l'actualité, etc. Il est adapté à l'entraînement et à l'évaluation des modèles de reconnaissance vocale automatique (RAP) et de synthèse vocale (TTS) cantonais, ainsi qu'au traitement de divers domaines et styles de parole dans des situations linguistiques réelles. Il permet également la vérification et l'évaluation des capacités de généralisation inter-domaines.

Composition des données :

  • Texte transcrit : Résultats de la reconnaissance automatique de la parole ;
  • Scores de confiance : tels que la confiance du texte et la confiance du pinyin cantonais ;
  • Attributs du locuteur : sexe, âge, identifiant du locuteur ;
  • Indicateurs de qualité vocale : tels que SNR et DNSMOS ;
  • Annotation temporelle : durée, horodatage au niveau du caractère ;
  • Métadonnées étendues : nom du programme, région, lien et informations d'inscription.

WenetSpeech-Yue.torrent
Partage 1Téléchargement 0Terminés 36Téléchargements totaux 76
  • WenetSpeech-Yue/
    • README.md
      2.12 KB
    • README.txt
      4.23 KB
      • data/
        • WenetSpeech-Yue.zip
          1.46 GB

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp