Réseau de Branches d'Attention Efficace avec Fonction de Perte Combinée pour la Détection Automatique des Tentatives de Tromperie en Vérification de Parole

De nombreuses initiatives ont visé à développer des techniques de contre-mesure pour améliorer les systèmes de Vérification Automatique de Parleur (VAP), afin de les rendre plus robustes face aux attaques par usurpation. Comme le montre le dernier défi de contre-mesure ASVspoof 2019, les modèles actuellement déployés pour la tâche de VAP sont, dans le meilleur des cas, dépourvus d'un niveau suffisant de généralisation face à des attaques inconnues. Une analyse plus approfondie des méthodes proposées révèle qu'une vision plus large et structurée en trois niveaux des systèmes proposés, comprenant le classifieur, la phase d'extraction de caractéristiques et la fonction de perte du modèle, pourrait, dans une certaine mesure, atténuer ce problème. En conséquence, cette étude propose une architecture modulaire du réseau Efficient Attention Branch Network (EABN) avec une fonction de perte combinée pour aborder le problème de généralisation...