
摘要
防欺骗自动说话人验证(SASV)系统是保护免受伪造语音攻击的关键技术。在本研究中,我们重点关注逻辑访问攻击,并提出了一种新的SASV方法。该方法基于时域波形幅度的概率质量函数(PMF),生成了真实和伪造语音的新表示。这一方法论从训练集中选定的组别生成了基于PMF的新颖时间嵌入。本文强调了性别分离的作用及其对性能的积极影响。我们提出了一种反制措施(CM)系统,该系统利用真实和伪造语音的时域嵌入以及基于男性和女性时间嵌入的性别识别。该方法表现出显著的性别识别能力,男性的不匹配率为0.94%,女性为1.79%。男性和女性CM系统的等错误率(EER)分别为8.67%和10.12%。通过将这种方法与传统的说话人验证系统相结合,我们在ASVspoof2019挑战数据库上展示了改进的泛化能力和串联检测成本函数评估。此外,我们探讨了将时间嵌入方法与传统CM融合的影响,并说明了这种融合如何增强SASV架构的泛化能力。