il y a 6 mois

Résumé

Ce document décrit deux systèmes de recherche par exemple développés par le Speech Lab de la Queens College (CUNY). Ces systèmes visaient à fournir des résultats de recherche rapides à partir de fichiers de référence sélectionnés. Trois reconnaisseurs phonétiques (tchèque, hongrois et russe) ont été utilisés pour extraire les séquences de phonèmes à la fois des fichiers vocaux de requête et des fichiers de référence. Chaque séquence de requête a été comparée à toutes les séquences de référence à l’aide à la fois d’aligneurs globaux et locaux. Dans le premier système, les fichiers de référence les plus probables ont été prédits à partir des résultats d’alignement de séquences ; dans le second système, les sous-séquences des séquences de référence ayant fourni les meilleurs alignements symboliques locaux ont été extraites, puis des caractéristiques MFCC à 39 dimensions ont été extraites à la fois pour la requête et pour ces sous-séquences. Les deux systèmes ont employé une version optimisée de l’algorithme DTW (Dynamic Time Warping), atteignant respectivement des scores Cnxe de 0,9989 et 1,0674 sur les données de test.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 6 mois

Traitement Audio Et Vocal

Reconnaissance Vocale

Text-to-Speech

Audio

Tâche

Andrew Rosenberg Min Ma

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 6 mois

Traitement Audio Et Vocal

Reconnaissance Vocale

Text-to-Speech

Audio

Tâche

Andrew Rosenberg Min Ma

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Systèmes CUNY pour la recherche par exemple sur la tâche de reconnaissance vocale à MediaEval 2015 | Articles | HyperAI

Command Palette

Systèmes CUNY pour la recherche par exemple sur la tâche de reconnaissance vocale à MediaEval 2015

Andrew Rosenberg Min Ma

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Systèmes CUNY pour la recherche par exemple sur la tâche de reconnaissance vocale à MediaEval 2015

Andrew Rosenberg Min Ma

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Systèmes CUNY pour la recherche par exemple sur la tâche de reconnaissance vocale à MediaEval 2015

Andrew Rosenberg Min Ma

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters