HyperAIHyperAI

Command Palette

Search for a command to run...

深層再帰ニューラルネットワークを用いた音響モデリング

William Chan Ian Lane

概要

自動音声認識(ASR)における音響モデリングのための新しい深層再帰ニューラルネットワーク(RNN)モデルを提案します。当該貢献をTC-DNN-BLSTM-DNNモデルと呼びます。このモデルは、時間畳み込み(TC)と深層ニューラルネットワーク(DNN)を組み合わせ、その後双方向長短期記憶(BLSTM)を経て、最終的にDNNを使用しています。最初のDNNは、当モデルの特徴量処理装置として機能し、BLSTMはシーケンス音響信号から文脈を生成し、最後のDNNはその文脈を取り入れて音響状態の事後確率をモデル化します。Wall Street Journal(WSJ)eval92タスクにおいて3.47%の単語誤り率(WER)を達成しており、ベースラインDNNモデルに対して8%以上の相対的な改善が見られます。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています