11日前

KUIELab-MDX-Net:音楽分離のための二重ストリームニューラルネットワーク

Minseok Kim, Woosung Choi, Jaehwa Chung, Daewon Lee, Soonyoung Jung
KUIELab-MDX-Net:音楽分離のための二重ストリームニューラルネットワーク
要約

近年、深層学習に基づく音楽ソース分離手法が多数提案されている。中には、多数の層とスキップ接続を重ねることでSDR(Signal-to-Distortion Ratio)性能が向上することを示した最先端の手法も存在する。このような深く複雑なアーキテクチャは優れた性能を発揮するが、通常、学習および評価に膨大な計算リソースと時間が必要となるという課題がある。本論文では、音楽デミックス(音源分離)に向けた二本のストリームから構成されるニューラルネットワーク、KUIELab-MDX-Netを提案する。本モデルは、性能とリソース要件のバランスに優れている。提案モデルは、時間周波数領域を扱うブランチと時間領域を扱うブランチの二本のストリームから構成され、それぞれが音源を独立して分離する。その後、二つのストリームの出力を統合して最終的な音源推定値を生成する。KUIELab-MDX-Netは、2021年ISMIRにおけるMusic Demixing Challengeにおいて、リーダーボードAで2位、リーダーボードBで3位を獲得した。また、本論文ではMUSDB18という他のベンチマークデータセットにおける実験結果も要約している。本研究のソースコードは公開されており、オンラインで入手可能である。

KUIELab-MDX-Net:音楽分離のための二重ストリームニューラルネットワーク | 最新論文 | HyperAI超神経