3달 전
TUKE 시스템 for MediaEval 2014 QUESST
{Jozef Juhár, Matúš Pleva, Martin Lojka, Peter Viszlay, Jozef Vavrek}

초록
이 논문에서는 코시체 기술대학(TUKE)이 말 작업(Query-by-Example Search on Speech Task, QUESST)을 위한 Query-by-Example(QbE) 검색 시스템에 제안한 두 가지 접근 방식을 제시한다. 본 연구의 주된 관심사는 외부 음성 자원을 사용하지 않고도 주어진 모든 쿼리를 검색할 수 있는 QbE 시스템을 구축하는 데 있다. 이를 위해 우리는 후보확률분포(POSTERIORGRAM) 기반의 키워드 매칭 시스템을 개발하였으며, 이는 각 쿼리가 특정 발화 파일 내에서 발생하는지를 탐지하기 위해 새로운 가중치를 적용한 빠른 순차적 동적 시간 왜곡 알고리즘(Weighted Fast Sequential DTW, WFS-DTW)을 활용하였다. 또한 두 가지 GMM 기반 음성 단위 모델링 접근 방식을 사용하였다. 첫 번째 접근 방식은 저자원(low-resource) 접근 방식으로, 언어에 의존적인 음소 디코더를 활용하여 쿼리 및 발화를 후보확률분포로 변환한다. 두 번째 접근 방식은 제로자원(zero-resource) 접근 방식으로, 제공된 발화 파일만을 사용하여 비지도 분할 및 군집화 기법을 결합하여 구현한다.