2 个月前

基于神经网络的音频超分辨率技术

Kuleshov, Volodymyr ; Enam, S. Zayd ; Ermon, Stefano
基于神经网络的音频超分辨率技术
摘要

我们介绍了一种新的音频处理技术,该技术利用深度卷积神经网络(deep convolutional neural networks)提高语音或音乐信号的采样率。我们的模型在低质量和高质量音频示例对上进行训练;在测试阶段,它通过类似于图像超分辨率的插值过程预测低分辨率信号中缺失的样本。我们的方法简单且不涉及专门的音频处理技术;在实验中,它在2倍、4倍和6倍的放大比例下优于基线方法,在标准的语音和音乐基准测试中表现出色。该方法在电话通信、压缩和文本转语音生成等领域具有实际应用价值;它展示了前馈卷积架构(feed-forward convolutional architectures)在音频生成任务中的有效性。

基于神经网络的音频超分辨率技术 | 最新论文 | HyperAI超神经