2 个月前

探索绿色人工智能在音频深度伪造检测中的应用

Saha, Subhajit ; Sahidullah, Md ; Das, Swagatam
探索绿色人工智能在音频深度伪造检测中的应用
摘要

最新的基于深度神经网络的音频深度伪造检测器展示了令人印象深刻的识别性能。然而,这一优势也伴随着显著的碳足迹。这主要是由于高性能计算加速器的使用以及较长的训练时间所致。研究表明,平均一个深度自然语言处理(NLP)模型在其生命周期内会产生约626,000磅的二氧化碳,相当于普通美国汽车一生排放量的五倍。这无疑对环境构成了巨大威胁。为应对这一挑战,本研究提出了一种新颖的音频深度伪造检测框架,该框架可以无缝地使用标准CPU资源进行训练。我们提出的框架利用了现成的自监督学习(SSL)模型,这些模型已经预先训练并在公共存储库中可用。与现有方法不同的是,现有方法通常对SSL模型进行微调并使用额外的深度神经网络来执行下游任务,而我们的方法则利用经典机器学习算法(如逻辑回归和浅层神经网络),通过预训练模型提取的SSL嵌入来进行检测。我们的方法在实验结果上与常用的高碳足迹方法具有竞争力。在使用ASVspoof 2019 LA数据集进行实验时,我们实现了0.90%的等错误率(EER),且模型参数少于1,000个可训练参数。为了鼓励在此方向上的进一步研究并支持可复现的结果,我们将公开提供Python代码以供下载和使用。GitHub链接:https://github.com/sahasubhajit/Speech-Spoofing-