HyperAIHyperAI

Command Palette

Search for a command to run...

Vérification de la falsification audio par apprentissage profond par transfert à l’aide de réseaux de neurones convolutifs

Rahul T P P R Aravind Ranjith C Usamath Nechiyil Nandakumar Paramparambath

Résumé

Les systèmes de vérification automatique de locuteur gagnent en popularité ces derniers temps ; les attaques par imitations (spoofing) constituent une préoccupation majeure, car elles rendent ces systèmes vulnérables. Certaines attaques par imitations, telles que les attaques par relecture (replay attacks), sont faciles à mettre en œuvre mais extrêmement difficiles à détecter, ce qui souligne la nécessité de contre-mesures adaptées. Dans cet article, nous proposons un classificateur vocal fondé sur un réseau de neurones convolutif profond afin de détecter les attaques par imitations. Notre approche utilise une représentation temporelle et fréquentielle acoustique des densités spectrales de puissance sur l’échelle de fréquence de Mel (Mel-spectrogramme), en s’appuyant sur l’apprentissage résiduel profond (adaptation de l’architecture ResNet-34). Grâce à un système basé sur un seul modèle, nous avons atteint un taux d’erreur égal (EER) de 0,9056 % sur le jeu de données de développement et de 5,32 % sur le jeu de données d’évaluation dans le scénario d’accès logique, ainsi qu’un EER de 5,87 % sur le jeu de données de développement et de 5,74 % sur le jeu de données d’évaluation dans le scénario d’accès physique, selon le benchmark ASVspoof 2019.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp