摘要
抗欺骗语音验证技术旨在保护基于语音的认证系统免受伪造攻击。此类系统应具备识别伪造语音片段的能力,并能够验证被判定为真实的语音片段确由真实说话人生成。本研究提出一种基于时域波形幅值概率质量函数(probability mass function)的可解释、可理解的嵌入表示方法。实验结果表明,当该反欺骗(Countermeasure, CM)系统采用性别相关策略时,其性能显著提升。研究采用ASVspoof2019挑战赛中的逻辑访问(Logical Access, LA)数据库进行评估。对于男性语音,该性别相关CM系统的等错误率(Equal Error Rate, EER)为9.2%;对于女性语音,EER为10.1%。相比之下,性别无关的CM系统EER为10.2%。在基于串联评估(tandem assessment, t-DCF)的检测代价函数(detection cost function)指标下,性别相关系统的性能为0.262,而性别无关系统为0.328,进一步验证了性别相关策略在提升系统鲁棒性方面的有效性。