字错率 Word Error Rate
字错率(Word Error Rate,简称 WER)是评估自动语音识别(ASR)系统性能的重要指标之一。它反映了语音识别过程中,错误识别的字词数量占总的字词数量的比例。 WER 越低,表明语音识别系统的性能越好。
WER 衡量的是从参考文本转换到识别/生成文本所需要的最少编辑次数(插入、删除、替换),并将其归一化为比例。值域范围通常为:0(完美匹配)到 1(完全错误),或用百分比表示(如 5% 错误率)。 WER 可以作为模型训练过程中的一个重要反馈指标。通过监控字错率的变化,研究人员可以调整模型的参数、优化训练策略,从而提高模型的性能。例如,在训练语音识别模型时,如果字错率过高,可能需要增加训练数据、改进模型架构或调整训练算法。