2달 전
Jam-ALT: 서식을 고려한 가사 전사 벤치마크
Ondřej Cífka; Constantinos Dimitriou; Cheng-i Wang; Hendrik Schreiber; Luke Miner; Fabian-Robert Stöter

초록
현재 자동 가사 전사(Automatic Lyrics Transcription, ALT) 벤치마크는 단어 내용에만 초점을 맞추고, 포맷팅과 문장 부호 등 가사의 미세한 특징을 무시하고 있어 음악가와 작곡가의 창작물 및 청취자의 경험과 잠재적으로 일치하지 않는 문제를 야기합니다. 예를 들어, 줄 바꿈은 리듬, 감정적 강조, 운율, 고차 구조 등의 정보를 전달하는 데 중요한 역할을 합니다. 이 문제를 해결하기 위해 Jam-ALT라는 새로운 가사 전사 벤치마크를 소개합니다. 이 벤치마크는 JamendoLyrics 데이터셋을 기반으로 합니다. 우리의 기여는 두 가지입니다. 첫째, ALT 평가를 위해 특별히 설계된 새로운 주석 가이드에 따라 음악 산업의 지침을 통합하여 포맷팅, 문장 부호, 철자, 배경 보컬, 비단어 소리 등을 포함한 전사본의 완전한 수정입니다. 둘째, 기존의 단어 오류율과 달리 이러한 현상을 포착하도록 설계된 평가 지표 모음입니다. 제안된 벤치마크가 ALT 작업에 기여하여 전사 시스템의 더 정확하고 신뢰성 있는 평가를 가능하게 하고, 실시간 캡션이나 카라오케용 자막 렌더링 등 가사 애플리케이션에서 사용자 경험을 향상시키기를 바랍니다.