语音识别是利用计算机识别人类语音的技术,其涉及面很广,与声学、语音学、语言学、信息理论、模式识别理论及神经生物学等学科都有密切的关系。
主流语音识别技术
- 动态事件规整 DTW:采用动态规整法,结合时间变换关系得到特征矢量间的距离,属于语音识别领域的经典算法;
- 隐马尔科夫模型 HMM:利用马尔科夫链中的状态表示发音过程,在单字生成过程中,系统从一个状态转移到另一个状态,并在每个状态下产生一个输出,直至该单字输出完毕;
- 人工神经网络 ANN:训练时间长。
语音识别难点
- 识别性能依赖周围环境,当训练环境与测试环境不一致时,效果会下降;
- 噪声问题,如何有效降噪;
- 语音信息的模糊性,如读音相似的词语,同音不同义的词语。
语音识别应用
语音识别正在成为计算机信息处理领域的关键技术,其应用范围包括语音拨号、语音导航、室内设备控制、语音文档检索、简易听写数据录入等,通过整合如机器翻译、语音合成等其他自然语言处理技术,可构建更为复杂的应用,如语音之间的翻译。