Die SPL-IT Abfrage per Beispiel-Suche im Sprachsystem für MediaEval 2014

Dieses Dokument beschreibt kurz das von der Speech Processing Lab des Instituto de Telecomunicações, Pol zu Coimbra (SPL-IT), für die Task „Query by Example Search on Speech“ (QUESST) im Rahmen von MediaEval 2014 eingereichte System. Unser Ansatz basiert auf der Fusion der Ergebnisse eines Phonemerkennungssystems, das drei verschiedene Sprachen nutzt. Es wurde eine Variante des Dynamic Time Warping (DTW), die auf Posteriorgram-Distanzen basiert, entwickelt, um bestimmte spezifische Suchfälle dieser Aufgabe zu erfassen. Die Haupteingabe kombiniert zwei Ansätze: ein einfaches DTW zur Erkennung ganzer Abfragen sowie eine Variante, bei der das Abschneiden von Teilen am Ende der Abfragen erlaubt ist. Die späte Einreichung fusioniert fünf Ansätze, die alle für die Aufgabe beschriebenen Suchmöglichkeiten berücksichtigen, wobei jedoch nur bei den Query-Typen vom Typ 3 Verbesserungen im Evaluationsdatensatz beobachtet wurden.