17 天前
计时器与类似任务:面向包含数字的口语理解的实用基准
Loren Lugosch, Piyush Papreja, Mirco Ravanelli, Abdelwahab Heba, Titouan Parcollet

摘要
本文介绍了 Timers and Such,这是一个全新的开源语音命令数据集,涵盖涉及数字的常见语音控制应用场景中的英语口语指令。文中阐述了现有语音理解数据集在该领域存在的空白,详细说明了该数据集的设计理念与构建过程,并对多种基于自动语音识别(ASR)及端到端的基线模型进行了实验验证。相关代码已作为 SpeechBrain 工具包的一部分公开发布。