HyperAIHyperAI

Command Palette

Search for a command to run...

Systèmes CUNY pour la recherche par exemple sur la tâche de reconnaissance vocale à MediaEval 2015

Andrew Rosenberg Min Ma

Résumé

Ce document décrit deux systèmes de recherche par exemple développés par le Speech Lab de la Queens College (CUNY). Ces systèmes visaient à fournir des résultats de recherche rapides à partir de fichiers de référence sélectionnés. Trois reconnaisseurs phonétiques (tchèque, hongrois et russe) ont été utilisés pour extraire les séquences de phonèmes à la fois des fichiers vocaux de requête et des fichiers de référence. Chaque séquence de requête a été comparée à toutes les séquences de référence à l’aide à la fois d’aligneurs globaux et locaux. Dans le premier système, les fichiers de référence les plus probables ont été prédits à partir des résultats d’alignement de séquences ; dans le second système, les sous-séquences des séquences de référence ayant fourni les meilleurs alignements symboliques locaux ont été extraites, puis des caractéristiques MFCC à 39 dimensions ont été extraites à la fois pour la requête et pour ces sous-séquences. Les deux systèmes ont employé une version optimisée de l’algorithme DTW (Dynamic Time Warping), atteignant respectivement des scores Cnxe de 0,9989 et 1,0674 sur les données de test.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp