HyperAI초신경

AISHELL-2 중국어 음성 데이터베이스

날짜

일 년 전

기관

발행 주소

www.aishelltech.com

라이선스

非商业用途

다운로드 도움말

AISHELL-2 중국어 표준어 음성 데이터베이스의 음성 지속시간은 1,000시간이며, 그 중 718시간은 AISHELL-ASR0009-[ZH-CN]에서, 282시간은 AISHELL-ASR0010-[ZH-CN]에서입니다. 녹음된 텍스트에는 웨이크업 단어, 음성 제어 단어, 스마트 홈, 무인 운전, 산업 생산을 포함한 12개 분야가 포함됩니다. 녹음 과정은 조용한 실내 환경에서 세 가지 다른 장치를 동시에 사용하여 진행되었습니다. 고음질 마이크(44.1kHz, 16비트); 안드로이드 폰(16kHz, 16비트) 그리고 iOS 폰(16kHz, 16비트). AISHELL-2는 iOS 휴대폰에서 녹음된 음성 데이터를 사용합니다. 중국 내 다양한 사투리 지역의 화자 1,991명이 녹음에 참여했습니다. 전문 음성 교정자가 필사하고 주석을 달고 엄격한 품질 검사를 통과한 이 데이터베이스의 텍스트 정확도는 96% 이상입니다. (학술 연구를 지원하며, 허가 없이 상업적 이용은 금지됩니다)