
摘要
本文介绍了GTM-UVigo团队在MediaEval 2015语音查询示例搜索任务(QUESST)中所开发的系统。该系统由11个基于动态时间规整(Dynamic Time Warping, DTW)的模块融合而成,采用音素后验图(phoneme posteriorgrams)作为语音表示。其中,主系统提出了一种方法,用于在每个音素解码器中选择最相关的语音单元,从而显著提升了搜索结果的性能。
本文介绍了GTM-UVigo团队在MediaEval 2015语音查询示例搜索任务(QUESST)中所开发的系统。该系统由11个基于动态时间规整(Dynamic Time Warping, DTW)的模块融合而成,采用音素后验图(phoneme posteriorgrams)作为语音表示。其中,主系统提出了一种方法,用于在每个音素解码器中选择最相关的语音单元,从而显著提升了搜索结果的性能。