HyperAIHyperAI
il y a 13 heures

Évaluation de la fuite d'identité dans les systèmes de désidentification vocale

Seungmin Seo, Oleg Aulov, Afzal Godil, Kevin Mangold
Évaluation de la fuite d'identité dans les systèmes de désidentification vocale
Résumé

La déidentification vocale vise à masquer l'identité d'un locuteur tout en préservant la compréhensibilité du discours sous-jacent. Nous proposons une référence (benchmark) permettant de mesurer le risque résiduel de fuite d'identité à l'aide de trois taux d'erreur complémentaires : le taux d'erreur équivalent (EER), le taux de réussite de la courbe caractéristique de correspondance cumulée (CMC), et la similarité dans l'espace d'embeddings évaluée à l'aide de l'analyse de corrélation canonique (CCA) et de l'analyse de Procrustes. Les résultats d'évaluation révèlent que tous les systèmes de déidentification vocale les plus avancés actuellement disponibles laissent échapper des informations d'identité. Le système le plus performant dans notre évaluation ne se distingue que légèrement du hasard, tandis que le système le moins performant atteint un taux de succès de 45 % parmi les 50 premiers candidats selon la courbe CMC. Ces résultats mettent en évidence des risques persistants pour la vie privée dans les technologies actuelles de déidentification vocale.