Système de l'Université de Hong Kong pour la tâche QUESST du MediaEval 2014

Ce papier présente un système de recherche de mots-clés parlés développé à l’Université chinoise de Hong Kong (CUHK) pour la tâche de recherche par exemple dans le domaine de la parole (QUESST) du MediaEval 2014. Ce système utilise des caractéristiques a posteriori ainsi que la mise en correspondance temporelle dynamique (DTW) pour la reconnaissance des mots-clés. Différents types de caractéristiques a posteriori sont générés à l’aide de divers tokenizers, puis fusionnés par une combinaison linéaire appliquée aux matrices de distance DTW. La contribution principale de ce système cette année réside dans une approche de regroupement par segments multi-vues (MSC) permettant la construction non supervisée du tokenizer ASM. Les scores Cnxe et ATWV de nos résultats soumis sur l’ensemble d’évaluation sont respectivement de 0,682 et de 0,412.