6 个月前

音频和语音处理

自然语言处理

自然语言处理

Carmen Garcia-Mateo Laura Docio-Fernandez Paula Lopez-Otero

摘要

本文介绍了GTM-UVigo团队在MediaEval 2015语音查询示例搜索任务（QUESST）中所开发的系统。该系统由11个基于动态时间规整（Dynamic Time Warping, DTW）的模块融合而成，采用音素后验图（phoneme posteriorgrams）作为语音表示。其中，主系统提出了一种方法，用于在每个音素解码器中选择最相关的语音单元，从而显著提升了搜索结果的性能。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供