2달 전

비계층적 트랜스포머를 사용한 자동 피아노 악보 생성을 위한 시간 구간 점수화

Yujia Yan; Zhiyao Duan
비계층적 트랜스포머를 사용한 자동 피아노 악보 생성을 위한 시간 구간 점수화
초록

신경 세미-마르코프 조건부 랜덤 필드(semi-CRF) 프레임워크는 이벤트 기반 피아노 트랜스크립션에서 유망한 결과를 보여주고 있습니다. 이 프레임워크에서는 모든 이벤트(음표 또는 페달)가 특정 이벤트 유형에 연결된 닫힌 시간 구간으로 표현됩니다. 신경 세미-CRF 접근 방식은 각 후보 구간에 점수를 할당하는 구간 점수 매트릭스가 필요합니다. 그러나 효율적이고 표현력이 뛰어난 구간 점수 매트릭스 설계는 쉽지 않습니다. 본 논문에서는 트랜스포머에서 주의 메커니즘의 점수화와 유사한 스케일된 내적 연산을 사용하여 구간을 점수화하는 간단한 방법을 소개합니다. 우리는 이론적으로, 비중복 구간을 인코딩하는 특별한 구조 덕분에, 경미한 조건 하에서 내적 연산이 이상적인 구간 점수 매트릭스를 충분히 표현할 수 있음을 증명합니다. 그런 다음, 저시간 해상도 피처 맵만을 처리하는 인코더 전용 구조화된 비계층 트랜스포머 백본이 고정확도와 고시간 정밀도로 피아노 음표와 페달을 트랜스크립션할 수 있음을 보여줍니다. 실험 결과, 우리의 접근 방식이 Maestro 데이터셋에서 F1 측정치로 평가했을 때 모든 하위 작업에서 새로운 최고 성능을 달성함을 확인할 수 있었습니다.

비계층적 트랜스포머를 사용한 자동 피아노 악보 생성을 위한 시간 구간 점수화 | 최신 연구 논문 | HyperAI초신경