ChildMandarin 어린이 중국어 대화 음성 데이터 세트
ChildMandarin 데이터 세트는 난카이대학교 컴퓨터과학부 AI 연구소와 인간언어기술연구실(HLT랩)이 2025년에 공개한 3~5세 어린이를 위한 포괄적인 중국어 음성 데이터 세트입니다. 이 데이터 세트는 이 연령대의 중국어 음성 데이터가 부족하다는 문제를 해결하기 위해 설계되었습니다. 관련 논문 결과는 다음과 같습니다.ChildMandarin: 3~5세 어린이를 위한 포괄적인 중국어 음성 데이터 세트"는 어린이 음성 인식 및 화자 검증 등 관련 연구 분야의 발전을 지원하는 것을 목표로 합니다.
데이터 세트 기능:
- 대용량 데이터: 3~5세 아동 397명, 총 41.25시간 분량의 대화 음성으로, 유사 데이터 세트 중에서 특정 이점을 가짐
- 광범위한 지리적 범위: 22개 주와 도시에서 데이터를 수집하여 지역적 다양성을 보장하고 다양한 악센트와 언어 습관을 포괄합니다.
- 자연스럽고 사실적인 상호작용: 부모가 안내하는 대화 수집 방법을 채택하여 자연스러운 의사소통 장면을 시뮬레이션하고 음성을 보다 사실적으로 표현합니다.
ChildMandarin.torrent
시딩 1다운로드 중 0완료됨 14총 다운로드 횟수 22