17 天前

DeepFilterNet:基于感知动机的实时语音增强

Hendrik Schröter, Tobias Rosenkranz, Alberto N. Escalante-B., Andreas Maier
DeepFilterNet:基于感知动机的实时语音增强
摘要

单通道语音增强的多帧算法能够利用语音信号在短时域内的相关性。深度滤波(Deep Filtering, DF)方法被提出,旨在直接在频域估计复数滤波器,以充分捕捉这些相关性。本文介绍了一款基于 DeepFilterNet 的实时语音增强演示系统。DeepFilterNet 的高效性得益于对语音产生机制和听觉感知心理声学特性的领域知识建模。该模型在保持与当前最先进语音增强基准相当性能的同时,可在单线程笔记本CPU上实现0.19的实时因子(real-time factor)。该框架及其预训练权重已以开源许可证形式公开发布。