HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données Du Corpus Cantonais WenetSpeech Yue

Date

il y a 5 mois

Taille

1.46 GB

Organisation

AISHELL
China Telecom
Université polytechnique du Nord-Ouest

URL du document

2509.03959

Licence

Non-Commercial

WenetSpeech Yue est un corpus vocal annoté multidimensionnel à grande échelle pour la reconnaissance vocale cantonaise (RAP) et la synthèse vocale (TTS). Il a été publié en 2025 par l'Université polytechnique Northwestern, l'Institut de recherche en intelligence artificielle de China Telecom, Beijing Hill Shell Technology Co., Ltd. et d'autres institutions. Les résultats de l'étude sont les suivants :WenetSpeech-Yue : un corpus de discours cantonais à grande échelle avec annotation multidimensionnelle", qui vise à combler le manque de ressources dans le domaine cantonais et à promouvoir la formation et l'évaluation de modèles cantonais de haute qualité.

L'ensemble de données contient environ 21 800 heures d'enregistrements cantonais, couvrant dix domaines, dont : la narration, le divertissement, le théâtre, la culture, les vlogs, les commentaires, l'éducation, les podcasts, l'actualité, etc. Il est adapté à l'entraînement et à l'évaluation des modèles de reconnaissance vocale automatique (RAP) et de synthèse vocale (TTS) cantonais, ainsi qu'au traitement de divers domaines et styles de parole dans des situations linguistiques réelles. Il permet également la vérification et l'évaluation des capacités de généralisation inter-domaines.

Composition des données :

  • Texte transcrit : Résultats de la reconnaissance automatique de la parole ;
  • Scores de confiance : tels que la confiance du texte et la confiance du pinyin cantonais ;
  • Attributs du locuteur : sexe, âge, identifiant du locuteur ;
  • Indicateurs de qualité vocale : tels que SNR et DNSMOS ;
  • Annotation temporelle : durée, horodatage au niveau du caractère ;
  • Métadonnées étendues : nom du programme, région, lien et informations d'inscription.

WenetSpeech-Yue.torrent
Seeding 1Téléchargement 0Terminé 56Total Downloads 190
  • WenetSpeech-Yue/
    • README.md
      2.12 KB
    • README.txt
      4.23 KB
      • data/
        • WenetSpeech-Yue.zip
          1.46 GB

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp