17日前

異なる音符状態間の相互相関を活用したポリフォニックピアノ音楽音符転記システム

{Chang Wook Ahn, Man-Je Kim, Donghyeon Lee, Taehyeon Kim}
要約

一般的に、多声部ピアノ音楽の音楽譜変換システムは、各音声フレームに対して音高活動とさまざまな音符状態を推定・決定するように設計されている。音楽情報検索(MIR)分野において音楽譜変換システムは多様な用途を持つが、音符イベントの構造が複雑であるため、さまざまな音符状態を正確に予測することは依然として困難な課題とされている。そのため、ニューラルネットワークアーキテクチャの設計アプローチは、各音符状態の同時予測を促進する方向へ進化してきた。しかし、近年のモデルは、異なる音符状態間の相互相関を効率的に活用できていない。本研究の主な貢献は、異なる音符状態間の相互相関を実証し、それをモデルアーキテクチャに反映した点にある。これにより、音楽譜変換システムはより明確な音符イベントを認識でき、実世界の高品質な出力を得ることが可能となった。我々は、特徴抽出段階においてこれらの相互相関を活用するためのキーネル共有型特徴抽出モジュールを提案する。さらに、音高エンベロープの形状を認識できるようにするため、音符状態検出段階における音符状態固有の検出モジュール間に関係性を追加した。本アーキテクチャの有効性は、Google Magentaが公開した公開データセットMAESTROを用いた一連の実験により徹底的に検証された。また、除去実験(ablation study)を実施することで、これらの相互相関の意義を示し、提案手法の影響力と重要性を明確にした。