18日前
MediaEval 2015 における音声システム向けの SPL-IT-UC 例示検索
{Fernando Perdigão, Luis Castela, Jorge Proença}

要約
本文は、ポルトガルコインブラのインスティトゥイド・ド・テレコムウニカções(コインブラ拠点)およびコインブラ大学の信号処理ラボ(SPL-IT-UC)が、MediaEval 2015の「例による音声検索(Query by Example Search on Speech Task, QUESST)」タスクに提出したシステムについて記述している。当該システムは、スペクトル減算法を用いて著しい背景ノイズをフィルタリングし、5つの音声認識器から事後確率を抽出して特徴量として利用する。また、複雑なクエリに特化した動的時系列歪み(Dynamic Time Warping, DTW)の新規な改良手法を導入し、線形キャリブレーションと融合処理を用いて検索結果を最適化している。本年度のタスクは音響環境および照合ケースの面で特に困難な課題を伴ったが、複数の複雑なアプローチを統合した場合に最も優れた性能が得られたことが観察された。