6 个月前

音频和语音处理

Seungmin Seo Oleg Aulov Afzal Godil Kevin Mangold

摘要

说话人去标识化旨在隐藏说话人的身份，同时保持语音内容的可理解性。我们提出一个基准测试方法，通过三种互补的错误率指标来量化残留的身份泄露程度：等错误率（Equal Error Rate）、累积匹配特性（Cumulative Match Characteristic, CMC）的命中率，以及基于典型相关分析（Canonical Correlation Analysis）和普鲁克鲁斯特分析（Procrustes Analysis）测得的嵌入空间相似性。评估结果表明，当前所有先进的说话人去标识化系统均存在身份信息泄露问题。在我们的评估中表现最优的系统，其性能仅略优于随机猜测；而表现最差的系统在前50名候选者中仍能达到45%的命中率（基于CMC指标）。这些发现凸显了当前说话人去标识化技术中持续存在的隐私风险。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

音频和语音处理

Seungmin Seo Oleg Aulov Afzal Godil Kevin Mangold

摘要

说话人去标识化旨在隐藏说话人的身份，同时保持语音内容的可理解性。我们提出一个基准测试方法，通过三种互补的错误率指标来量化残留的身份泄露程度：等错误率（Equal Error Rate）、累积匹配特性（Cumulative Match Characteristic, CMC）的命中率，以及基于典型相关分析（Canonical Correlation Analysis）和普鲁克鲁斯特分析（Procrustes Analysis）测得的嵌入空间相似性。评估结果表明，当前所有先进的说话人去标识化系统均存在身份信息泄露问题。在我们的评估中表现最优的系统，其性能仅略优于随机猜测；而表现最差的系统在前50名候选者中仍能达到45%的命中率（基于CMC指标）。这些发现凸显了当前说话人去标识化技术中持续存在的隐私风险。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供