CSEMOTIONS 감정 오디오 데이터 세트

CSEMOTIONS는 알리바바가 2025년에 발표한 감성 오디오 데이터 세트입니다. 관련 논문 결과는 다음과 같습니다.마르코-보이스 기술 보고서"제어 가능성과 자연어 음성 생성 분야의 연구를 지원하는 것을 목표로 합니다.

이 데이터세트는 약 10시간 분량의 고품질 오디오 데이터를 포함하고 있으며, 전문 성우 10명(남성 5명, 여성 5명)이 침착함, 행복함, 화남, 슬픔, 놀람, 역겨움, 두려움 등 7가지 감정 범주에 대해 녹음한 오디오를 포함합니다. 각 감정에는 500~700개의 중국어 텍스트 녹음이 포함되어 있습니다.