HyperAI超神经

首页资讯最新论文教程数据集百科 SOTA LLM 模型天梯 GPU 天梯顶会

中文

HyperAI超神经

语音识别 Speech Recognition

语音识别是利用计算机识别人类语音的技术，其涉及面很广，与声学、语音学、语言学、信息理论、模式识别理论及神经生物学等学科都有密切的关系。

主流语音识别技术

动态事件规整 DTW：采用动态规整法，结合时间变换关系得到特征矢量间的距离，属于语音识别领域的经典算法；
隐马尔科夫模型 HMM：利用马尔科夫链中的状态表示发音过程，在单字生成过程中，系统从一个状态转移到另一个状态，并在每个状态下产生一个输出，直至该单字输出完毕；
人工神经网络 ANN：训练时间长。

语音识别难点

识别性能依赖周围环境，当训练环境与测试环境不一致时，效果会下降；
噪声问题，如何有效降噪；
语音信息的模糊性，如读音相似的词语，同音不同义的词语。

语音识别应用

语音识别正在成为计算机信息处理领域的关键技术，其应用范围包括语音拨号、语音导航、室内设备控制、语音文档检索、简易听写数据录入等，通过整合如机器翻译、语音合成等其他自然语言处理技术，可构建更为复杂的应用，如语音之间的翻译。