Utiliser ce jeu de données Discuter sur Discord

Date

il y a 7 mois

Organisation

URL du document

2509.18004

Licence

Apache 2.0

Balises

Text-to-Speech

Entraînement Du Modèle

WenetSpeech-Chuan est un ensemble de données vocales à grande échelle en dialecte Sichuan-Chongqing, publié en 2025 par l'Université polytechnique du Nord-Ouest en collaboration avec Hillbeak, l'Institut de recherche en intelligence artificielle de China Telecom et d'autres institutions. L'article de recherche associé s'intitule « WenetSpeech-Chuan : un corpus sichuanais à grande échelle avec une annotation riche pour le traitement de la parole dialectale". Cet ensemble de données contient 10 013 heures d'enregistrements authentiques de dialectes du Sichuan et de Chongqing, dont 3 714 heures de données fortement annotées et 6 299 heures de données faiblement annotées. Les données couvrent neuf scénarios réels : 52 831 heures sont constituées de courtes vidéos, le reste comprenant des contenus de divertissement, des diffusions en direct, des livres audio, des documentaires, des interviews, des actualités, des lectures et des séries télévisées, offrant ainsi une distribution vocale très diversifiée et réaliste. Chaque enregistrement est accompagné d'annotations détaillées, incluant le contenu textuel, le niveau de confiance, la qualité vocale, le sexe et l'âge du locuteur, ainsi que des étiquettes émotionnelles.

Ce jeu de données est fourni par les utilisateurs de la communauté et est destiné uniquement à des fins éducatives et informatives. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour examen et retrait rapides.

undefined

Ensemble De Données d'imagerie Par Résonance Magnétique Fonctionnelle THINGS-fMRI

il y a 5 mois

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

il y a 2 jours

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

il y a 6 mois

Ensemble De Données De Détection De Contrebande Par Rayons X

il y a 6 mois

Ensemble De Données d'évaluation Complète En Contexte Long LongBench-Pro

il y a 2 jours

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Utiliser ce jeu de données Discuter sur Discord

Date

il y a 7 mois

Organisation

URL du document

2509.18004

Licence

Apache 2.0

Balises

Text-to-Speech

Entraînement Du Modèle

undefined

Ensemble De Données d'enseignement Et d'entraînement Préalables Sutra 10B

il y a 3 mois

Ensemble De Données EEG THINGS-EEG

il y a 5 mois

Ensemble De Données De Magnétoencéphalographie THINGS-MEG

il y a 5 mois

Ensemble De Données d'imagerie Par Résonance Magnétique Fonctionnelle THINGS-fMRI

il y a 5 mois

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

il y a 2 jours

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

il y a 6 mois

Ensemble De Données De Détection De Contrebande Par Rayons X

il y a 6 mois

Ensemble De Données d'évaluation Complète En Contexte Long LongBench-Pro

il y a 2 jours

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Ensemble De Données Vocales WenetSpeech-Chuan Sichuan-Chongqing

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données Vocales WenetSpeech-Chuan Sichuan-Chongqing

undefined

Ensemble De Données d'enseignement Et d'entraînement Préalables Sutra 10B

Ensemble De Données EEG THINGS-EEG

Ensemble De Données De Magnétoencéphalographie THINGS-MEG

Ensemble De Données d'imagerie Par Résonance Magnétique Fonctionnelle THINGS-fMRI

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

Ensemble De Données De Détection De Contrebande Par Rayons X

Ensemble De Données d'évaluation Complète En Contexte Long LongBench-Pro

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données Vocales WenetSpeech-Chuan Sichuan-Chongqing

undefined

Ensemble De Données d'enseignement Et d'entraînement Préalables Sutra 10B

Ensemble De Données EEG THINGS-EEG

Ensemble De Données De Magnétoencéphalographie THINGS-MEG

Ensemble De Données d'imagerie Par Résonance Magnétique Fonctionnelle THINGS-fMRI

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

Ensemble De Données De Détection De Contrebande Par Rayons X

Ensemble De Données d'évaluation Complète En Contexte Long LongBench-Pro

Créer de l'IA avec l'IA

HyperAI Newsletters

undefined

Ensemble De Données d'enseignement Et d'entraînement Préalables Sutra 10B

Ensemble De Données EEG THINGS-EEG

Ensemble De Données De Magnétoencéphalographie THINGS-MEG

Ensemble De Données d'imagerie Par Résonance Magnétique Fonctionnelle THINGS-fMRI

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

Ensemble De Données De Détection De Contrebande Par Rayons X

Ensemble De Données d'évaluation Complète En Contexte Long LongBench-Pro

undefined

Ensemble De Données d'enseignement Et d'entraînement Préalables Sutra 10B

Ensemble De Données EEG THINGS-EEG

Ensemble De Données De Magnétoencéphalographie THINGS-MEG

Ensemble De Données d'imagerie Par Résonance Magnétique Fonctionnelle THINGS-fMRI

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

Ensemble De Données De Détection De Contrebande Par Rayons X

Ensemble De Données d'évaluation Complète En Contexte Long LongBench-Pro