HyperAIHyperAI
il y a 2 mois

Systèmes CUNY pour la recherche par exemple sur la tâche de reconnaissance vocale à MediaEval 2015

{Andrew Rosenberg, Min Ma}
Systèmes CUNY pour la recherche par exemple sur la tâche de reconnaissance vocale à MediaEval 2015
Résumé

Ce document décrit deux systèmes de recherche par exemple développés par le Speech Lab de la Queens College (CUNY). Ces systèmes visaient à fournir des résultats de recherche rapides à partir de fichiers de référence sélectionnés. Trois reconnaisseurs phonétiques (tchèque, hongrois et russe) ont été utilisés pour extraire les séquences de phonèmes à la fois des fichiers vocaux de requête et des fichiers de référence. Chaque séquence de requête a été comparée à toutes les séquences de référence à l’aide à la fois d’aligneurs globaux et locaux. Dans le premier système, les fichiers de référence les plus probables ont été prédits à partir des résultats d’alignement de séquences ; dans le second système, les sous-séquences des séquences de référence ayant fourni les meilleurs alignements symboliques locaux ont été extraites, puis des caractéristiques MFCC à 39 dimensions ont été extraites à la fois pour la requête et pour ces sous-séquences. Les deux systèmes ont employé une version optimisée de l’algorithme DTW (Dynamic Time Warping), atteignant respectivement des scores Cnxe de 0,9989 et 1,0674 sur les données de test.

Systèmes CUNY pour la recherche par exemple sur la tâche de reconnaissance vocale à MediaEval 2015 | Articles de recherche | HyperAI