
要約
本稿では、MediaEval 2015 で実施された「例による検索(Query by Example Search on Speech, QUESST)」タスクに対して、GTM-UVigo チームが開発したシステムについて報告する。本システムは、音素後ろ向き確率グラム(phoneme posteriorgrams)を音声表現に用いる11種類の動的時系列歪み(Dynamic Time Warping, DTW)ベースのシステムを統合したアプローチである。主システムでは、各音素デコーダーにおいて最も関連性の高い音素単位を選択する手法を導入しており、これにより検索結果の性能が向上した。