2ヶ月前

人間用歌詞転写:読みやすさを考慮したベンチマーク

Ondřej Cífka; Hendrik Schreiber; Luke Miner; Fabian-Robert Stöter
人間用歌詞転写:読みやすさを考慮したベンチマーク
要約

人間が歌詞を書き留める際には、単に言葉の順序を正確に捉えるだけでなく、明瞭さと文脈情報を伝えるために句読点やフォーマットを組み込む必要があります。これには、曲の構造、感情的な強調、およびリードボーカルとバックボーカルの対比が含まれます。自動歌詞転記(Automatic Lyrics Transcription: ALT)システムは、単なる言葉の無構造な列から進化し、より広い文脈を活用できるようになりましたが、ALTベンチマークはその進歩に追いついておらず、依然として言葉のみに焦点を当てています。このギャップに対処するため、私たちは包括的な歌詞転記ベンチマークであるJam-ALTを導入します。このベンチマークでは、業界標準の歌詞転記とフォーマットに準拠してJamendoLyricsデータセットを完全に見直し、歌詞特有のニュアンスを捉え評価するための指標も設計されています。これらの改善により、歌詞の読みやすさ向上の基盤が築かれます。私たちはこのベンチマークを最近の転記システムに適用し、追加の誤り分析を行い、クラシック音楽データセットとの実験的比較も示します。

人間用歌詞転写:読みやすさを考慮したベンチマーク | 最新論文 | HyperAI超神経