HyperAIHyperAI

Command Palette

Search for a command to run...

DeepFilterNet:基于感知动机的实时语音增强

Hendrik Schröter Tobias Rosenkranz Alberto N. Escalante-B. Andreas Maier

摘要

单通道语音增强的多帧算法能够利用语音信号在短时域内的相关性。深度滤波(Deep Filtering, DF)方法被提出,旨在直接在频域估计复数滤波器,以充分捕捉这些相关性。本文介绍了一款基于 DeepFilterNet 的实时语音增强演示系统。DeepFilterNet 的高效性得益于对语音产生机制和听觉感知心理声学特性的领域知识建模。该模型在保持与当前最先进语音增强基准相当性能的同时,可在单线程笔记本CPU上实现0.19的实时因子(real-time factor)。该框架及其预训练权重已以开源许可证形式公开发布。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供