HyperAIHyperAI

Command Palette

Search for a command to run...

多声部音楽モデルの改善に特徴豊富な符号化を用いる

Omar Peracha

概要

本論文では、深層ニューラルネットワークを用いた多声音楽の逐次モデリングについて考察します。最近の研究は主にネットワークアーキテクチャに焦点を当てていますが、我々はシーケンスの表現が検証セット損失で測定されるモデルの性能に対して同等に重要な貢献をする可能性があることを示します。訓練データセットに内在する特徴量を抽出することで、モデルはこれらの特徴量に基づいて条件付けられるか、または予測対象として追加のシーケンス成分として訓練することができます。我々は、より複雑なシーケンス(予測対象となる系列に追加の特徴量が含まれている)を予測するようにニューラルネットワークを訓練することで、全体的なモデル性能が大幅に向上することを示します。まず、GRUベースのモデルであるTonicNetを紹介します。TonicNetは、各時間ステップでのコードを最初に予測し、その後その時間ステップでの各声部の音符を予測するように訓練されます。これは通常の方法(音符のみを予測する)とは異なります。次に、JSB Choralesデータセット上でTonicNetの評価を行い、最先端の結果を得ました。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています