9 小时前

说话人去标识系统中的身份泄露评估

Seungmin Seo, Oleg Aulov, Afzal Godil, Kevin Mangold
说话人去标识系统中的身份泄露评估
摘要

说话人去标识化旨在隐藏说话人的身份,同时保持语音内容的可理解性。我们提出一个基准测试方法,通过三种互补的错误率指标来量化残留的身份泄露程度:等错误率(Equal Error Rate)、累积匹配特性(Cumulative Match Characteristic, CMC)的命中率,以及基于典型相关分析(Canonical Correlation Analysis)和普鲁克鲁斯特分析(Procrustes Analysis)测得的嵌入空间相似性。评估结果表明,当前所有先进的说话人去标识化系统均存在身份信息泄露问题。在我们的评估中表现最优的系统,其性能仅略优于随机猜测;而表现最差的系统在前50名候选者中仍能达到45%的命中率(基于CMC指标)。这些发现凸显了当前说话人去标识化技术中持续存在的隐私风险。