6 个月前

音频和语音处理

Itshak Lapidot Yehuda Ben-Shimol Avishai Weizman

摘要

抗欺骗语音验证技术旨在保护基于语音的认证系统免受伪造攻击。此类系统应具备识别伪造语音片段的能力，并能够验证被判定为真实的语音片段确由真实说话人生成。本研究提出一种基于时域波形幅值概率质量函数（probability mass function）的可解释、可理解的嵌入表示方法。实验结果表明，当该反欺骗（Countermeasure, CM）系统采用性别相关策略时，其性能显著提升。研究采用ASVspoof2019挑战赛中的逻辑访问（Logical Access, LA）数据库进行评估。对于男性语音，该性别相关CM系统的等错误率（Equal Error Rate, EER）为9.2%；对于女性语音，EER为10.1%。相比之下，性别无关的CM系统EER为10.2%。在基于串联评估（tandem assessment, t-DCF）的检测代价函数（detection cost function）指标下，性别相关系统的性能为0.262，而性别无关系统为0.328，进一步验证了性别相关策略在提升系统鲁棒性方面的有效性。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

音频和语音处理

Itshak Lapidot Yehuda Ben-Shimol Avishai Weizman

摘要

抗欺骗语音验证技术旨在保护基于语音的认证系统免受伪造攻击。此类系统应具备识别伪造语音片段的能力，并能够验证被判定为真实的语音片段确由真实说话人生成。本研究提出一种基于时域波形幅值概率质量函数（probability mass function）的可解释、可理解的嵌入表示方法。实验结果表明，当该反欺骗（Countermeasure, CM）系统采用性别相关策略时，其性能显著提升。研究采用ASVspoof2019挑战赛中的逻辑访问（Logical Access, LA）数据库进行评估。对于男性语音，该性别相关CM系统的等错误率（Equal Error Rate, EER）为9.2%；对于女性语音，EER为10.1%。相比之下，性别无关的CM系统EER为10.2%。在基于串联评估（tandem assessment, t-DCF）的检测代价函数（detection cost function）指标下，性别相关系统的性能为0.262，而性别无关系统为0.328，进一步验证了性别相关策略在提升系统鲁棒性方面的有效性。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供