
要約
我々は、音楽ソース分離(Meta-TasNet)において、階層的なメタラーニングを想起させるモデルを提案する。このモデルでは、生成モデルを用いて個々の抽出器モデルの重みを予測する。これにより、効率的なパラメータ共有が可能となる一方で、楽器ごとのパラメータ化も維持できる。Meta-TasNetは、独立に訓練されたモデルやマルチタスク学習設定でのモデルと比較して、より優れた性能を示し、最先端の手法と同等の性能を達成している。さらに、これらの手法と比較して、本モデルの抽出器はパラメータ数が少なく、実行時間も高速である。本研究では、重要なアーキテクチャ上の考察を提示し、本アプローチのコストと利点についても検討する。