18 天前
基于示例的语音检索查询在MediaEval 2015语音系统中的应用:SPL-IT-UC
{Fernando Perdigão, Luis Castela, Jorge Proença}

摘要
本文描述了由科英布拉电信研究所(Instituto de Telecomunicações,科英布拉校区)信号处理实验室(Signal Processing Lab)与科英布拉大学联合组成的SPL-IT-UC团队,为MediaEval 2015媒体评测任务中的“语音示例查询搜索”(Query by Example Search on Speech Task, QUESST)所构建的系统。该系统通过谱减法有效抑制了大量背景噪声,采用五个音素识别器,提取其后验概率作为特征;针对复杂查询,对动态时间规整(Dynamic Time Warping, DTW)算法实施了创新性改进,并结合线性校准与结果融合策略以优化最终性能。尽管本年度任务在声学条件和匹配案例方面更具挑战性,但实验结果表明,将所有复杂方法进行融合可取得最佳性能。