il y a 8 mois

Ahmed Ali Najim Dehak Patrick Cardinal Sameer Khurana Sree Harsha Yella James Glass Peter Bell Steve Renals

Résumé

Nous examinons différentes approches pour l'identification des dialectes dans les discours arabes diffusés à la radio, en utilisant des caractéristiques phonétiques et lexicales obtenues à partir d'un système de reconnaissance vocale, ainsi que des caractéristiques acoustiques basées sur le cadre i-vecteur. Nous avons étudié à la fois des classifieurs génératifs et discriminants, et nous avons combiné ces caractéristiques en utilisant une machine à vecteurs de support (Support Vector Machine, SVM) multiclasses. Nous avons validé nos résultats sur une tâche d'identification de la langue arabe/anglaise, avec une précision de 100 %. Nous avons utilisé ces caractéristiques dans un classifieur binaire pour distinguer entre l'arabe standard moderne (MSA) et l'arabe dialectal, avec une précision de 100 %. Nous rapportons également les résultats obtenus en utilisant notre méthode pour discriminer entre les cinq dialectes arabes les plus couramment utilisés : l'égyptien, le golfe, le levantin, le nord-africain et l'MSA, avec une précision de 52 %. Nous discutons des erreurs d'identification des dialectes dans le contexte du code-switching entre l'arabe dialectal et l'MSA, et nous comparons les motifs d'erreur entre les données manuellement étiquetées et la sortie de notre classifieur. Nous mettons également à disposition les données d'apprentissage et de test comme corpus standard pour l'identification des dialectes.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 8 mois

Traitement Audio Et Vocal

Traitement Du Langage Naturel

Classification Audio

Traitement Du Langage Naturel

Audio

Tâche

Ahmed Ali Najim Dehak Patrick Cardinal Sameer Khurana Sree Harsha Yella James Glass Peter Bell Steve Renals

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 8 mois

Traitement Audio Et Vocal

Traitement Du Langage Naturel

Classification Audio

Traitement Du Langage Naturel

Audio

Tâche

Ahmed Ali Najim Dehak Patrick Cardinal Sameer Khurana Sree Harsha Yella James Glass Peter Bell Steve Renals

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Détection automatique de dialectes dans les émissions arabes à la radio et à la télévision

Ahmed Ali Najim Dehak Patrick Cardinal Sameer Khurana Sree Harsha Yella James Glass Peter Bell Steve Renals

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Détection automatique de dialectes dans les émissions arabes à la radio et à la télévision

Ahmed Ali Najim Dehak Patrick Cardinal Sameer Khurana Sree Harsha Yella James Glass Peter Bell Steve Renals

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Détection automatique de dialectes dans les émissions arabes à la radio et à la télévision

Ahmed Ali Najim Dehak Patrick Cardinal Sameer Khurana Sree Harsha Yella James Glass Peter Bell Steve Renals

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters