3 个月前

TUKE系统用于MediaEval 2014 QUESST

{Jozef Juhár, Matúš Pleva, Martin Lojka, Peter Viszlay, Jozef Vavrek}
TUKE系统用于MediaEval 2014 QUESST
摘要

本文介绍了斯洛伐克科希策技术大学(TUKE)为语音查询任务(QUESST)提出的两种查询-by-例(Query-by-Example, QbE)检索系统方法。本研究的主要目标是构建一种QbE系统,该系统能够在不依赖任何外部语音资源的情况下,实现对所有给定查询的准确检索。为此,我们提出了一种基于后验图(posteriorgram)的关键词匹配系统,并引入了一种新型加权快速序列动态时间规整算法(Weighted Fast Sequential DTW, WFS-DTW),用于在特定语音语句文件中检测每个查询的出现位置。该系统采用两种基于高斯混合模型(GMM)的声学单元建模方法。第一种方法称为“低资源方法”(low-resource approach),利用语言相关的音素解码器,将查询和语音语句转换为后验图。第二种方法称为“零资源方法”(zero-resource approach),仅依赖所提供的语音语句文件,通过无监督的语音分割与聚类技术实现建模,无需任何外部语言或语音资源。

TUKE系统用于MediaEval 2014 QUESST | 论文 | HyperAI超神经