HyperAIHyperAI
vor 3 Monaten

TUKE-System für MediaEval 2014 QUESST

{Jozef Juhár, Matúš Pleva, Martin Lojka, Peter Viszlay, Jozef Vavrek}
TUKE-System für MediaEval 2014 QUESST
Abstract

In diesem Beitrag werden zwei Ansätze für ein QbE-System (Query-by-Example) vorgestellt, die von der Technischen Universität Košice (TUKE) im Rahmen der Speech-Abfrageaufgabe des QUESST-Wettbewerbs entwickelt wurden. Unser Hauptaugenmerk lag auf der Entwicklung eines QbE-Systems, das in der Lage ist, alle vorgegebenen Abfragen zu finden, sowohl mit als auch ohne Verwendung externer Sprachressourcen. Dazu haben wir ein auf Posteriorgrammen basierendes Schlüsselwort-Abgleichsystem entwickelt, das einen neuartigen gewichteten schnellen sequentiellen Varianten des DTW-Algorithmus (WFS-DTW) einsetzt, um die Auftreten jeder Abfrage innerhalb eines bestimmten Sprechäußerungsdatei zu detektieren. Hierbei werden zwei Ansätze zur Modellierung von akustischen Einheiten basierend auf GMM (Gaussian Mixture Models) verwendet. Der erste Ansatz, als Low-Resource-Ansatz bezeichnet, nutzt sprachabhängige phonetische Decoder, um Abfragen und Sprechäußerungen in Posteriorgramme zu transformieren. Der zweite Ansatz, als Zero-Resource-Ansatz definiert, setzt auf eine Kombination aus unsupervisierter Segmentierung und Clustering-Techniken, wobei ausschließlich die bereitgestellten Sprechäußerungsdateien genutzt werden.