2ヶ月前

MediaEval 2015 における音声システム向けの SPL-IT-UC 例示検索

{Fernando Perdigão, Luis Castela, Jorge Proença}

要約

本文は、ポルトガルコインブラのインスティトゥイド・ド・テレコムウニカções（コインブラ拠点）およびコインブラ大学の信号処理ラボ（SPL-IT-UC）が、MediaEval 2015の「例による音声検索（Query by Example Search on Speech Task, QUESST）」タスクに提出したシステムについて記述している。当該システムは、スペクトル減算法を用いて著しい背景ノイズをフィルタリングし、5つの音声認識器から事後確率を抽出して特徴量として利用する。また、複雑なクエリに特化した動的時系列歪み（Dynamic Time Warping, DTW）の新規な改良手法を導入し、線形キャリブレーションと融合処理を用いて検索結果を最適化している。本年度のタスクは音響環境および照合ケースの面で特に困難な課題を伴ったが、複数の複雑なアプローチを統合した場合に最も優れた性能が得られたことが観察された。