il y a 8 mois

Résumé

Les assistants vocaux, tels que les enceintes intelligentes, ont connu une explosion de popularité. On estime actuellement que le taux d'adoption des enceintes intelligentes a dépassé 35 % chez les adultes aux États-Unis. Les fabricants ont intégré une technologie d'identification des locuteurs, qui vise à déterminer l'identité de la personne parlant, afin de fournir des services personnalisés à différents membres de la même famille. L'identification des locuteurs peut également jouer un rôle important dans la gestion de l'utilisation de l'enceinte intelligente. Par exemple, il n'est pas crucial d'identifier correctement l'utilisateur lorsqu'il s'agit de diffuser de la musique. Cependant, lorsqu'il s'agit de lire à haute voix les e-mails de l'utilisateur, il est essentiel de vérifier correctement que la personne faisant la demande est bien l'utilisateur autorisé. Des systèmes d'authentification des locuteurs, qui vérifient l'identité du locuteur, sont donc nécessaires pour agir comme garde-fou et protéger contre diverses attaques par usurpation visant à imiter l'utilisateur inscrit. Cet article compare les frontales apprenantes populaires qui apprennent les représentations audio par entraînement conjoint avec les tâches downstream (End-to-End). Nous classons ces frontales en définissant deux architectures génériques et analysons ensuite les étapes de filtrage des deux types en termes de contraintes d'apprentissage. Nous proposons de remplacer les bancs de filtres fixes par une couche apprenante qui peut mieux s'adapter aux tâches anti-usurpation. La frontale FastAudio proposée est ensuite testée avec deux back-ends populaires pour mesurer ses performances sur le parcours LA du dataset ASVspoof 2019. La frontale FastAudio réalise une amélioration relative de 27 % par rapport aux frontales fixes, surpassant toutes les autres frontales apprenantes sur cette tâche.

PDF source Voir le code

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 8 mois

Traitement Audio Et Vocal

Apprentissage Profond

Apprentissage Multi-tâches

Hassan Saeed

Résumé

PDF source Voir le code

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 8 mois

Traitement Audio Et Vocal

Apprentissage Profond

Apprentissage Multi-tâches

Hassan Saeed

Résumé

PDF source Voir le code

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

FastAudio : Une interface audio apprenable pour la détection de la parole simulée

Hassan Saeed

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

FastAudio : Une interface audio apprenable pour la détection de la parole simulée

Hassan Saeed

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

FastAudio : Une interface audio apprenable pour la détection de la parole simulée

Hassan Saeed

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters