HyperAIHyperAI

Command Palette

Search for a command to run...

Jam-ALT:一种格式感知的歌词转录基准

Ondřej Cífka Constantinos Dimitriou Cheng-i Wang Hendrik Schreiber Luke Miner Fabian-Robert Stöter

摘要

当前自动歌词转录(ALT)基准测试仅关注词汇内容,忽略了书面歌词中的细微差别,包括格式和标点符号,这可能导致与音乐家和作词者的创意作品以及听众体验之间的潜在错位。例如,换行在传达节奏、情感强调、押韵和高层次结构信息方面起着重要作用。为了解决这一问题,我们引入了基于 JamendoLyrics 数据集的新歌词转录基准——Jam-ALT。我们的贡献有两方面:首先,对转录进行了全面修订,专门针对 ALT 评估,遵循新创建的注释指南,统一了音乐行业的标准,涵盖了标点符号、换行、拼写、背景人声和非词语声音等方面;其次,设计了一套评价指标,与传统的词错误率不同,这套指标能够捕捉到上述现象。我们希望所提出的基准测试能够促进 ALT 任务的发展,使转录系统的评估更加精确可靠,并提升歌词应用(如实时字幕或卡拉OK字幕渲染)的用户体验。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供