2ヶ月前

時間遅延ニューラルネットワークを用いた効率的なキーワード検出

Samuel Myer; Vikrant Singh Tomar
時間遅延ニューラルネットワークを用いた効率的なキーワード検出
要約

本論文では、2段階時間遅延ニューラルネットワークを用いた新しいリアルタイムキーワード検出方法について述べる。モデルの学習は転移学習を使用して行われ、大規模な音声コーパスからの電話番号目標での初期学習に続き、较小データセットからのキーワード目標での学習が行われる。システムの精度は2つの異なるタスクで評価された。1つ目は自由に利用可能なGoogle Speech Commandsデータセットであり、2つ目はキーワード検出のために特別に開発された社内タスクである。結果は、既知の技術と比較してクリーン環境およびノイジー環境において偽陽性率と偽陰性率に大幅な改善が見られたことを示している。さらに、1秒あたりの乗算回数という観点から計算量を削減するための様々な手法を調査した。最近発表された研究と比較して、提案されたシステムは計算複雑さにおいて最大89%の節約を提供する。注:「电话目标」在这里可能是指「音素目标」(phoneme targets),因为通常在语音识别中,电话指的是电话号码,而音素是语音的基本单位。如果确实是指音素目标,请告知我以便进行修正。