2ヶ月前

IBM 2015年の英語会話電話音声認識システム

George Saon; Hong-Kwang J. Kuo; Steven Rennie; Michael Picheny
IBM 2015年の英語会話電話音声認識システム
要約

IBMの英語会話電話音声認識システムにおける最新の改善点について説明します。有効であると確認された技術は以下の通りです:アネールドドロップアウト率を用いたマックスアウトネットワーク;2000時間のデータで学習した非常に多数の出力を持つネットワーク;ボトルネック層と出力層を組み合わせて部分的に展開された再帰型ニューラルネットワークと畳み込みニューラルネットワークを共同モデリングし、得られたモデルを再学習する手法;そして最後に、指数型言語モデル(Exponential LM)およびニューラルネットワーク言語モデル(Neural Network LM)を使用した洗練された言語モデルスコアリング。これらの技術により、Hub5-2000評価テストセットのSwitchboard部分において8.0%の単語誤り率が達成され、これは我々がこれまでに公表した最良結果よりも相対的に23%改善しています。

IBM 2015年の英語会話電話音声認識システム | 最新論文 | HyperAI超神経