
要約
本研究では、公開されている事前学習済みのJukeboxモデルを用いて、単一の混合音声チャンネルからの音声源分離問題に適応する手法を示す。本研究で提案するニューラルネットワークアーキテクチャは、転移学習を活用しており、学習にかかる時間が短く、他の最先端手法と同等の性能を達成している。なお、これらの手法は膨大な計算リソース、大量の学習データ、および長時間の訓練を要するのに対し、本手法はそれらをはるかに抑えることができる。本研究のアーキテクチャのオープンソース実装コードをGitHubにて公開している(https://github.com/wzaielamri/unmix)。