日期
机构
发布地址
github.com
标签
音声の分類
分类
CSS10 は、10 か国語による単一話者の音声のデータセットです。データセットには、LibriVox オーディオブックの短いオーディオ クリップとその調整されたテキストが含まれています。研究者らはまた、音声データセットの品質を検証するために、音声データセットに基づいてテキストから音声を生成する 2 つのニューラル モデルをトレーニングしました。このデータセットは、将来的には音声タスクに使用できます。