Système TUKE pour MediaEval 2014 QUESST

Deux approches pour un système de recherche par exemple (QbE) proposées par l’Université technique de Košice (TUKE) dans le cadre de la tâche de recherche par exemple dans le domaine de la parole (QUESST) sont présentées dans cet article. Notre principal objectif était de concevoir un système QbE capable de retrouver toutes les requêtes fournies, que ce soit avec ou sans recourir à des ressources vocales externes. À cette fin, nous avons développé un système de correspondance de mots-clés basé sur les posteriorgrams, qui exploite un nouvel algorithme séquentiel rapide pondéré de la distance de Dynamic Time Warping (WFS-DTW) afin de détecter la présence de chaque requête au sein d’un fichier d’énoncé donné, en utilisant deux approches de modélisation des unités acoustiques fondées sur les modèles de mélanges gaussiens (GMM). La première approche, désignée comme méthode à faibles ressources, utilise des décodeurs phonétiques dépendants de la langue pour convertir les requêtes et les énoncés en posteriorgrams. La seconde approche, définie comme méthode sans ressource (zero-resource), met en œuvre une combinaison de techniques de segmentation et de regroupement non supervisées, en n'utilisant que les fichiers d’énoncés fournis.