HyperAIHyperAI

Command Palette

Search for a command to run...

基于扩散模型的语音增强方差分析

Bunlong Lay Timo Gerkmann

摘要

扩散模型在语音增强任务中展现出强大的生成能力。在近期的SGMSE+方法中,训练过程基于随机微分方程(stochastic differential equation, SDE)来建模扩散过程,逐步向干净语音信号中添加高斯噪声与环境噪声。语音增强性能在很大程度上取决于所选用的随机微分方程,该方程决定了在扩散过程中均值与方差演化的规律。本文指出,方差的尺度是影响语音增强性能的关键参数,并进一步表明,该参数在噪声抑制与语音失真之间起到权衡作用。具体而言,我们证明了较大的方差能够提升噪声抑制能力,同时降低计算开销,因为生成语音估计所需的函数求值次数相应减少。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供