CSS10音声データセット

CSS10 は、10 か国語による単一話者の音声のデータセットです。データセットには、LibriVox オーディオブックの短いオーディオ クリップとその調整されたテキストが含まれています。研究者らはまた、音声データセットの品質を検証するために、音声データセットに基づいてテキストから音声を生成する 2 つのニューラル モデルをトレーニングしました。このデータセットは、将来的には音声タスクに使用できます。
CSS10 は、10 か国語による単一話者の音声のデータセットです。データセットには、LibriVox オーディオブックの短いオーディオ クリップとその調整されたテキストが含まれています。研究者らはまた、音声データセットの品質を検証するために、音声データセットに基づいてテキストから音声を生成する 2 つのニューラル モデルをトレーニングしました。このデータセットは、将来的には音声タスクに使用できます。