2 个月前

使用时延神经网络实现高效的关键词检测

Samuel Myer; Vikrant Singh Tomar
使用时延神经网络实现高效的关键词检测
摘要

本文介绍了一种基于两阶段时延神经网络(Time Delay Neural Network, TDNN)的实时关键词检测新方法。该模型采用迁移学习进行训练:首先使用大规模语音语料库中的音素目标进行初步训练,然后使用较小数据集中的关键词目标进行进一步训练。系统的准确性在两个独立的任务中进行了评估。第一个任务是公开可用的Google语音命令数据集;第二个任务是我们专门为关键词检测开发的内部任务。结果显示,与已知的先前技术相比,该系统在清洁和嘈杂环境中均显著降低了误接受率和误拒绝率。此外,我们还研究了多种减少每秒音频乘法运算次数的技术。与最近发表的工作相比,所提出的系统在计算复杂度方面最高可节省89%的资源。