HyperAIHyperAI
il y a 2 mois

Vérification automatique robuste aux spoofing de la parole en tandem basée sur les plongements dans le domaine temporel

Weizman, Avishai ; Ben-Shimol, Yehuda ; Lapidot, Itshak
Vérification automatique robuste aux spoofing de la parole en tandem basée sur les plongements dans le domaine temporel
Résumé

Les systèmes de vérification automatique de locuteur résistants au spoofing (SASV) sont une technologie cruciale pour la protection contre les discours falsifiés. Dans cette étude, nous nous concentrons sur les attaques d'accès logique et présentons une nouvelle approche pour les tâches de SASV. Une nouvelle représentation des discours authentiques et falsifiés est utilisée, basée sur la fonction de masse de probabilité (FMP) des amplitudes du signal en domaine temporel. Cette méthodologie génère des plongements temporels novateurs issus de la FMP de groupes sélectionnés dans l'ensemble d'entraînement. L'article met en lumière le rôle de la ségrégation par genre et son impact positif sur les performances. Nous proposons un système de contre-mesure (CM) qui utilise des plongements temporels dérivés de la FMP des discours authentiques et falsifiés, ainsi qu'une reconnaissance du genre basée sur des plongements temporels masculins et féminins. La méthode montre des capacités notables de reconnaissance du genre, avec des taux d'incompatibilité respectifs de 0,94 % pour les hommes et 1,79 % pour les femmes. Les systèmes CM masculin et féminin atteignent respectivement un taux d'erreur équivalent (TEÉ) de 8,67 % et 10,12 %. En intégrant cette approche aux systèmes traditionnels de vérification de locuteur, nous démontrons une meilleure capacité généralisatrice et une évaluation optimisée de la fonction coût détectant en tandem, en utilisant la base de données du défi ASVspoof2019. De plus, nous examinons l'impact de la fusion de l'approche par plongement temporel avec le CM traditionnel et illustrons comment cette fusion améliore la généralisation dans les architectures SASV.

Vérification automatique robuste aux spoofing de la parole en tandem basée sur les plongements dans le domaine temporel | Articles de recherche récents | HyperAI