HyperAI

CSS10-Sprachdatensatz

Datum

vor 3 Jahren

Organisation

Veröffentlichungs-URL

github.com

Download-Hilfe
特色图像

CSS10 ist ein Datensatz mit Einzelsprechersprachen in zehn Sprachen. Der Datensatz enthält kurze Audioclips aus LibriVox-Hörbüchern und deren kalibrierte Transkripte. Die Forscher trainierten außerdem zwei neuronale Modelle zur Generierung von Sprache aus Text basierend auf dem Sprachdatensatz, um die Qualität des Sprachdatensatzes zu überprüfen. Der Datensatz kann zukünftig für Sprachaufgaben verwendet werden.