6 个月前

音频和语音处理

自然语言处理

自然语言处理

and Chris Biemann Max Mühlhäuser Stefan Radomski Evandro Gouvea Arvid Lange Benjamin Milde Stephan Radeck-Arneth

摘要

我们提出一个全新的、免费开放的德语远场语音识别语料库，并报告了基于该语料库训练的两款开源语音识别器的独立说话人词错误率（WER）结果。该语料库在受控环境下录制，使用三种不同麦克风，录制距离为一米。语料库包含180位不同说话人，总计36小时的音频数据。我们展示了使用开源工具包Kaldi（WER为20.5%）和PocketSphinx（WER为39.6%）的识别结果，从而为德语远场语音识别提供了完整的开源解决方案。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供