2ヶ月前

MediaEval 2014 における Speech システム向けの SPL-IT 例示検索によるクエリ

{Fernando Perdigão, Arlindo Veiga, Jorge Proença}

要約

本稿では、コイムブラ拠点（SPL-IT）を有するインスティトゥート・デ・テレコミウニカーザォンズ（Instituto de Telecomunicações）の音声処理ラボが、MediaEval 2014の「例による音声検索タスク（QUESST）」に提出したシステムについて概説する。本研究のアプローチは、3つの異なる言語を用いた音素認識システムの結果を統合するものである。本タスクにおける特異な検索ケースに対応するため、後続確率グラム（posteriorgram）距離を用いた動的時系列ワーピング（DTW）の改良版を構築した。主な提出では、全体のクエリ検出に用いるシンプルなDTWと、クエリの末尾部分を切り詰めることが可能なバージョンの2つのアプローチを統合した。一方、後発の提出では、タスクで提示されたすべての検索可能性に対応するため、合計5つのアプローチを統合したが、評価データセットにおいては、タイプ3のクエリに関してのみ、改善された結果が得られた。