CSEMOTIONSは、アリババが2025年にリリースした感情的な音声データセットです。関連する論文の結果は次のとおりです。Marco-Voice 技術レポート「制御性と自然言語音声生成の分野での研究を支援することを目的としています。
このデータセットには、約10時間分の高品質音声データが含まれており、10人のプロの声優(男性5名、女性5名)による、穏やか、幸せ、怒り、悲しみ、驚き、嫌悪、恐怖の7つの感情カテゴリーの音声が収録されています。各感情には、500~700件の中国語テキストが含まれています。