Command Palette
Search for a command to run...
Ensemble De Données Du Corpus Cantonais WenetSpeech Yue
Date
Taille
URL de l'article
Licence
Non-Commercial
WenetSpeech Yue est un corpus vocal annoté multidimensionnel à grande échelle pour la reconnaissance vocale cantonaise (RAP) et la synthèse vocale (TTS). Il a été publié en 2025 par l'Université polytechnique Northwestern, l'Institut de recherche en intelligence artificielle de China Telecom, Beijing Hill Shell Technology Co., Ltd. et d'autres institutions. Les résultats de l'étude sont les suivants :WenetSpeech-Yue : un corpus de discours cantonais à grande échelle avec annotation multidimensionnelle", qui vise à combler le manque de ressources dans le domaine cantonais et à promouvoir la formation et l'évaluation de modèles cantonais de haute qualité.
L'ensemble de données contient environ 21 800 heures d'enregistrements cantonais, couvrant dix domaines, dont : la narration, le divertissement, le théâtre, la culture, les vlogs, les commentaires, l'éducation, les podcasts, l'actualité, etc. Il est adapté à l'entraînement et à l'évaluation des modèles de reconnaissance vocale automatique (RAP) et de synthèse vocale (TTS) cantonais, ainsi qu'au traitement de divers domaines et styles de parole dans des situations linguistiques réelles. Il permet également la vérification et l'évaluation des capacités de généralisation inter-domaines.
Composition des données :
- Texte transcrit : Résultats de la reconnaissance automatique de la parole ;
- Scores de confiance : tels que la confiance du texte et la confiance du pinyin cantonais ;
- Attributs du locuteur : sexe, âge, identifiant du locuteur ;
- Indicateurs de qualité vocale : tels que SNR et DNSMOS ;
- Annotation temporelle : durée, horodatage au niveau du caractère ;
- Métadonnées étendues : nom du programme, région, lien et informations d'inscription.
Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.