2ヶ月前

非階層変換器を用いた自動ピアノ転写のための時間間隔スコアリング

Yujia Yan; Zhiyao Duan
非階層変換器を用いた自動ピアノ転写のための時間間隔スコアリング
要約

ニューラル半マルコフ条件随机场(semi-CRF)フレームワークは、イベントベースのピアノ転写において有望な結果を示しています。このフレームワークでは、すべてのイベント(音符やペダル)が特定のイベントタイプに結びついた閉区間として表現されます。ニューラル半CRFアプローチには、各候補区間にスコアを割り当てる区間スコアリング行列が必要です。しかし、効率的かつ表現力豊かな区間スコアリング行列の設計は容易ではありません。本論文では、トランスフォーマーにおける注意スコアリングと類似したスケーリング内積演算を使用して区間をスコアリングする簡単な方法を提案します。理論的に示すように、非重複区間を符号化する特殊構造により、比較的緩い条件下で内積演算は理想的なスコアリング行列を表現するのに十分であり、正しい転写結果を得ることができます。さらに、低時間解像度の特徴マップのみで動作するエンコーダーのみの構造化された階層的でないトランスフォーマー主幹部が、高精度かつ高時間精度でピアノの音符とペダルを転写できることが実証されています。実験結果によると、我々の手法はMaestroデータセットにおいてF1値で全てのサブタスクにおいて新しい最先端性能を達成しています。

非階層変換器を用いた自動ピアノ転写のための時間間隔スコアリング | 最新論文 | HyperAI超神経