AISHELL-DMASH 중국어 만다린 마이크 어레이 홈 장면 음성 데이터베이스
AISHELL-DMASH 데이터 세트는 두 개의 서로 다른 방에서 실제 스마트 홈 시나리오를 통해 기록되었으며 30,000시간 분량의 음성 데이터를 포함하고 있습니다.녹음 장비는 근거리 마이크와 방의 7개 위치에 설치된 7세트의 장비로 구성되었습니다. 녹음 장비 세트에는 iPhone, Android 휴대폰, iPad, 마이크, 반경 5cm의 원형 마이크 어레이가 포함됩니다. 이 데이터 세트에는 511명의 화자가 포함되어 있으며, 각 화자는 7~15일 간격으로 3번씩 방문을 받았습니다. AISHELL-DMASH 데이터 세트는 전문 음성 주석자가 98%의 단어 정확도로 필사한 것입니다. 음성인식, 음성인식, 웨이크업 단어 인식 등의 연구에 활용될 수 있습니다.