CSS10-Sprachdatensatz
Datum
vor 3 Jahren
Veröffentlichungs-URL
Kategorien

CSS10 ist ein Datensatz mit Einzelsprechersprachen in zehn Sprachen. Der Datensatz enthält kurze Audioclips aus LibriVox-Hörbüchern und deren kalibrierte Transkripte. Die Forscher trainierten außerdem zwei neuronale Modelle zur Generierung von Sprache aus Text basierend auf dem Sprachdatensatz, um die Qualität des Sprachdatensatzes zu überprüfen. Der Datensatz kann zukünftig für Sprachaufgaben verwendet werden.