Ensemble De Données Audio Émotionnelles CSEMOTIONS
Date
il y a 3 jours
URL de publication
Licence
Apache 2.0
CSEMOTIONS est un ensemble de données audio émotionnelles publié par Alibaba en 2025. Les résultats de l'article associé sont «Rapport technique Marco-Voice« Vise à soutenir la recherche dans les domaines de la contrôlabilité et de la génération de parole en langage naturel.
Cet ensemble de données contient environ 10 heures de données audio de haute qualité, couvrant les enregistrements de 10 doubleurs professionnels (5 hommes et 5 femmes) répartis en sept catégories d'émotions : calme, joie, colère, tristesse, surprise, dégoût et peur. Chaque émotion contient 500 à 700 enregistrements de texte chinois.