HyperAIHyperAI

Command Palette

Search for a command to run...

TUKE-System für MediaEval 2014 QUESST

Jozef Juhár Matúš Pleva Martin Lojka Peter Viszlay Jozef Vavrek

Zusammenfassung

In diesem Beitrag werden zwei Ansätze für ein QbE-System (Query-by-Example) vorgestellt, die von der Technischen Universität Košice (TUKE) im Rahmen der Speech-Abfrageaufgabe des QUESST-Wettbewerbs entwickelt wurden. Unser Hauptaugenmerk lag auf der Entwicklung eines QbE-Systems, das in der Lage ist, alle vorgegebenen Abfragen zu finden, sowohl mit als auch ohne Verwendung externer Sprachressourcen. Dazu haben wir ein auf Posteriorgrammen basierendes Schlüsselwort-Abgleichsystem entwickelt, das einen neuartigen gewichteten schnellen sequentiellen Varianten des DTW-Algorithmus (WFS-DTW) einsetzt, um die Auftreten jeder Abfrage innerhalb eines bestimmten Sprechäußerungsdatei zu detektieren. Hierbei werden zwei Ansätze zur Modellierung von akustischen Einheiten basierend auf GMM (Gaussian Mixture Models) verwendet. Der erste Ansatz, als Low-Resource-Ansatz bezeichnet, nutzt sprachabhängige phonetische Decoder, um Abfragen und Sprechäußerungen in Posteriorgramme zu transformieren. Der zweite Ansatz, als Zero-Resource-Ansatz definiert, setzt auf eine Kombination aus unsupervisierter Segmentierung und Clustering-Techniken, wobei ausschließlich die bereitgestellten Sprechäußerungsdateien genutzt werden.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
TUKE-System für MediaEval 2014 QUESST | Paper | HyperAI