2ヶ月前

深層ニューラルネットワークを用いた音楽帯域拡張のフィルタ一般化について

Sulun, Serkan ; Davies, Matthew E. P.
深層ニューラルネットワークを用いた音楽帯域拡張のフィルタ一般化について
要約

本論文では、音声強化の広範な分野におけるサブトピックである音楽音声の帯域拡張に焦点を当てます。深層ニューラルネットワークを使用して帯域拡張問題を定式化し、帯域制限信号をネットワークへの入力として提供し、フル帯域出力を再構成することを目指します。当研究の主な貢献は、ネットワークの学習およびテスト時に選択するローパスフィルターの影響に関するものです。2つの最先端の深層アーキテクチャ、ResNetとU-Netについて、学習用とテスト用のフィルターが一致する場合、最大7dBまでの信号対雑音比(SNR)の向上が得られることを示しています。しかし、これらのフィルターが異なる場合、改善度は大幅に低下し、ある学習条件下では帯域制限信号よりも低いSNRとなることがあります。このフィルタ形状に対する過学習を回避するために、複数のローパスフィルターを学習中に利用するデータ拡張戦略を提案します。これにより、テスト時の未知のフィルタ条件に対する汎化性能が向上します。

深層ニューラルネットワークを用いた音楽帯域拡張のフィルタ一般化について | 最新論文 | HyperAI超神経