HyperAIHyperAI

Command Palette

Search for a command to run...

IBM 2016年の英語会話電話音声認識システム

George Saon Tom Sercu Steven Rennie Hong-Kwang J. Kuo

概要

我々は、英語の会話型電話音声認識(LVCSR)システムの単語誤り率を、Hub5 2000評価テストセットのSwitchboardサブセットにおいて記録的な6.6%に低下させた一連の音響モデルおよび言語モデル技術について説明します。音響モデルに関しては、以下の3つの強力なモデルのスコア融合を使用しています:マックスアウト活性化を持つ再帰ネットワーク、3x3カーネルを使用する非常に深い畳み込みネットワーク、およびFMLLRおよびi-ベクトル特徴量を処理する双方向長期短期記憶(LSTM)ネットワーク。言語モデルに関しては、更新されたモデル「M」および階層的ニューラルネットワーク言語モデル(LM)を使用しています。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
IBM 2016年の英語会話電話音声認識システム | 記事 | HyperAI超神経