
要約
我々は、多様な音楽範囲での汎用性と高精度を目的としたビートおよびダウンビートの追跡システムを提案します。汎用性を達成するために、複数のデータセット(ソロ楽器録音、拍子変更のある曲、テンポ変動が大きいクラシック音楽など)で学習を行います。また、一般的に使用されている動的ベイジアンネットワーク (DBN) の後処理を削除することで、拍子やテンポに対する制約を取り除きます。高精度を実現するためには、他の改善点とともに、アノテーションの小さな時間ずれに耐える損失関数を開発し、周波数または時間に対して畳み込みとトランスフォーマーを交互に適用するアーキテクチャを設計しました。当システムはDBNを使用せずにF1スコアにおいて現行の最先端技術を上回っています。しかし、特に難易度が高く代表されていないジャンルでは失敗することもあり、連続性指標では劣る性能となっています。そこで我々はモデル、コード、および前処理済みデータセットを公開し、他者にこの成果を超えていただくことを呼びかけます。