HyperAIHyperAI

Command Palette

Search for a command to run...

深層ニューラルネットワークを用いた音楽帯域拡張のフィルタ一般化について

Serkan Sulun Matthew E. P. Davies

概要

本論文では、音声強化の広範な分野におけるサブトピックである音楽音声の帯域拡張に焦点を当てます。深層ニューラルネットワークを使用して帯域拡張問題を定式化し、帯域制限信号をネットワークへの入力として提供し、フル帯域出力を再構成することを目指します。当研究の主な貢献は、ネットワークの学習およびテスト時に選択するローパスフィルターの影響に関するものです。2つの最先端の深層アーキテクチャ、ResNetとU-Netについて、学習用とテスト用のフィルターが一致する場合、最大7dBまでの信号対雑音比(SNR)の向上が得られることを示しています。しかし、これらのフィルターが異なる場合、改善度は大幅に低下し、ある学習条件下では帯域制限信号よりも低いSNRとなることがあります。このフィルタ形状に対する過学習を回避するために、複数のローパスフィルターを学習中に利用するデータ拡張戦略を提案します。これにより、テスト時の未知のフィルタ条件に対する汎化性能が向上します。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています