摘要
本文报告了我们在构建一种面向新兴低资源语言(Fongbe)的自动语音识别(ASR)系统方面的研究工作。本研究旨在为Fongbe语建立声学模型与语言模型,以支持连续语音的解码任务。Fongbe语是一种主要在贝宁、多哥和尼日利亚使用的非洲语言,其面临的挑战在于目前尚无可用于ASR系统的任何语言资源。为此,本研究首先收集了Fongbe语的文本与语音语料库,相关数据在后续章节中详细描述。声学建模在音素层面(graphemic level)完成,语言建模则构建了两个语言模型,以供性能对比分析。此外,为探究声调变音符号对语言模型性能的影响,我们还实施了一种元音简化处理,即去除音调标记。