17일 전
오픈 소스 독일어 원거리 음성 인식: 코퍼스 및 음성 모델
{and Chris Biemann, Max Mühlhäuser, Stefan Radomski, Evandro Gouvea, Arvid Lange, Benjamin Milde, Stephan Radeck-Arneth}

초록
우리는 독일어 원거리 음성 인식을 위한 새로운 무료 공개 코퍼스를 제안하고, 이 코퍼스를 기반으로 훈련된 두 가지 오픈소스 음성 인식기의 독립적 화자(WER) 결과를 보고한다. 이 코퍼스는 거리 1미터에서 세 가지 다른 마이크를 사용하여 통제된 환경에서 기록되었으며, 총 180명의 다양한 화자로 구성되어 총 36시간의 음성 데이터를 포함한다. 오픈소스 툴킷인 Kaldi(20.5% WER)와 PocketSphinx(39.6% WER)를 활용한 인식 결과를 제시하며, 독일어 원거리 음성 인식을 위한 완전한 오픈소스 솔루션의 실현 가능성을 입증한다.