2ヶ月前
データ駆動の堅牢な自動ピアノ譜記号化の分析
Drew Edwards; Simon Dixon; Emmanouil Benetos; Akira Maezawa; Yuta Kusaka

要約
自動ピアノ楽譜生成のアルゴリズムは、新しいデータセットとモデリング手法のおかげで、近年著しく進歩しました。最近の発展は主に新しいニューラルネットワークアーキテクチャ(例えば、TransformerやPerceiver)を適応させることに焦点を当てており、より正確なシステムの実現を目指しています。本研究では、これらのシステムの訓練データの観点から検討します。分布外の注釈付きピアノデータでの性能を測定することで、これらのモデルが訓練データの音響特性に対して深刻に過学習する可能性を示しています。私たちはMAESTROデータセットのために新しいオーディオセットを作成し、ヤマハディスクラヴィエルの再生によりプロフェッショナルスタジオ録音環境で自動的にキャプチャしました。元のMAESTROデータセットと再演奏版を使用して訓練する際に様々なデータ拡張技術を用いることで、MAPSデータセットにおいて88.4のF1スコアという最先端のノートオンセット精度を達成しました(その訓練データを見ることなく)。その後、一連の削除実験を通じてこれらのデータ拡張技術が結果的なモデルに及ぼす影響をより深く理解するために分析を行いました。