HyperAI超神经

摘要

我们介绍了一种基于端到端深度学习的最新语音识别系统。与依赖精心设计的处理管道的传统语音系统相比，我们的架构显著简化；而这些传统系统在嘈杂环境中往往表现不佳。相比之下，我们的系统无需手动设计组件来建模背景噪声、混响或说话人变化，而是直接学习一种对这些效应具有鲁棒性的函数。我们不需要音素字典，甚至不需要“音素”这一概念。我们方法的关键在于一个经过良好优化的递归神经网络（RNN）训练系统，该系统使用多个GPU，并且采用了一系列新颖的数据合成技术，使我们能够高效地获得大量多样化的训练数据。我们的系统称为Deep Speech，在广泛研究的Switchboard Hub5'00测试集上超过了以往公布的最佳结果，实现了16.0%的错误率。此外，Deep Speech在处理具有挑战性的嘈杂环境方面也优于广泛使用的、最先进的商业语音系统。

摘要

Awni Hannun* Carl Case Jared Casper Bryan Catanzaro Greg Diamos Erich Elsen Ryan Prenger Sanjeev Satheesh Shubho Sengupta Adam Coates

摘要

用 AI 构建 AI

HyperAI Newsletters

Awni Hannun* Carl Case Jared Casper Bryan Catanzaro Greg Diamos Erich Elsen Ryan Prenger Sanjeev Satheesh Shubho Sengupta Adam Coates

摘要

用 AI 构建 AI

HyperAI Newsletters

Awni Hannun* Carl Case Jared Casper Bryan Catanzaro Greg Diamos Erich Elsen Ryan Prenger Sanjeev Satheesh Shubho Sengupta Adam Coates

摘要

用 AI 构建 AI

HyperAI Newsletters

Command Palette

深度语音：扩展端到端语音识别

Awni Hannun* Carl Case Jared Casper Bryan Catanzaro Greg Diamos Erich Elsen Ryan Prenger Sanjeev Satheesh Shubho Sengupta Adam Coates1 more

摘要

用 AI 构建 AI

HyperAI Newsletters

Command Palette

深度语音：扩展端到端语音识别

Awni Hannun* Carl Case Jared Casper Bryan Catanzaro Greg Diamos Erich Elsen Ryan Prenger Sanjeev Satheesh Shubho Sengupta Adam Coates1 more

摘要

用 AI 构建 AI

HyperAI Newsletters

Command Palette

深度语音：扩展端到端语音识别

Awni Hannun* Carl Case Jared Casper Bryan Catanzaro Greg Diamos Erich Elsen Ryan Prenger Sanjeev Satheesh Shubho Sengupta Adam Coates1 more

摘要

用 AI 构建 AI

HyperAI Newsletters

Awni Hannun* Carl Case Jared Casper Bryan Catanzaro Greg Diamos Erich Elsen Ryan Prenger Sanjeev Satheesh Shubho Sengupta Adam Coates

Awni Hannun* Carl Case Jared Casper Bryan Catanzaro Greg Diamos Erich Elsen Ryan Prenger Sanjeev Satheesh Shubho Sengupta Adam Coates

Awni Hannun* Carl Case Jared Casper Bryan Catanzaro Greg Diamos Erich Elsen Ryan Prenger Sanjeev Satheesh Shubho Sengupta Adam Coates