HyperAI

Ensemble De Données Vocales CSS10

Date

il y a 3 ans

Organisation

URL de publication

github.com

Aide au téléchargement
特色图像

CSS10 est un ensemble de données de discours d'un seul locuteur dans dix langues. L'ensemble de données contient de courts extraits audio de livres audio LibriVox et leurs transcriptions calibrées. Les chercheurs ont également formé deux modèles neuronaux pour générer de la parole à partir de texte en fonction de l'ensemble de données vocales afin de vérifier la qualité de l'ensemble de données vocales. L'ensemble de données peut être utilisé pour des tâches vocales à l'avenir.