HyperAIHyperAI
il y a 18 jours

Systèmes CUNY pour la recherche par exemple sur la tâche de reconnaissance vocale à MediaEval 2015

{Andrew Rosenberg, Min Ma}
Systèmes CUNY pour la recherche par exemple sur la tâche de reconnaissance vocale à MediaEval 2015
Résumé

Ce document décrit deux systèmes de recherche par exemple développés par le Speech Lab de la Queens College (CUNY). Ces systèmes visaient à fournir des résultats de recherche rapides à partir de fichiers de référence sélectionnés. Trois reconnaisseurs phonétiques (tchèque, hongrois et russe) ont été utilisés pour extraire les séquences de phonèmes à la fois des fichiers vocaux de requête et des fichiers de référence. Chaque séquence de requête a été comparée à toutes les séquences de référence à l’aide à la fois d’aligneurs globaux et locaux. Dans le premier système, les fichiers de référence les plus probables ont été prédits à partir des résultats d’alignement de séquences ; dans le second système, les sous-séquences des séquences de référence ayant fourni les meilleurs alignements symboliques locaux ont été extraites, puis des caractéristiques MFCC à 39 dimensions ont été extraites à la fois pour la requête et pour ces sous-séquences. Les deux systèmes ont employé une version optimisée de l’algorithme DTW (Dynamic Time Warping), atteignant respectivement des scores Cnxe de 0,9989 et 1,0674 sur les données de test.