HyperAIHyperAI

Command Palette

Search for a command to run...

Microsoft 2016年の対話型音声認識システム

W. Xiong; J. Droppo; X. Huang; F. Seide; M. Seltzer; A. Stolcke; D. Yu; G. Zweig

概要

マイクロソフトの対話型音声認識システムについて説明します。このシステムでは、ニューラルネットワークに基づく音響モデルと言語モデルの最近の進展を組み合わせることで、スイッチボード認識タスクにおける最先端技術をさらに推進しています。機械学習のアンサンブル技術に着想を得て、システムはさまざまな畳み込みニューラルネットワーク(CNN)と再帰型ニューラルネットワーク(RNN)を使用しています。i-ベクトルモデリングとラティスフリーMMIトレーニングは、すべての音響モデルアーキテクチャに対して大幅な改善をもたらします。複数の前方および後方実行RNNLM(再帰型ニューラルネットワーク言語モデル)による言語モデル再スコアリングと単語事後確率に基づくシステム結合により、20%の性能向上が見られます。最良の単一システムはResNetアーキテクチャの音響モデルを使用し、RNNLM再スコアリングを組み合わせることでNIST 2000 スイッチボードタスクにおいて6.9%の単語誤り率を達成しました。結合されたシステムは6.2%の誤り率を達成しており、このベンチマークタスクにおける以前に報告された結果よりも優れています。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています