8일 전
다중 수준의 심층 시퀀스의 교차 유사도 행렬을 활용한 커버 곡 식별을 위한 유사도 학습
{Xiaoou Chen, Chaoya Jiang, Deshun Yang}
초록
최근 몇 년간 커버 곡 식별을 위한 여러 가지 딥러닝 모델이 제안되었으며, 이들 모델은 음악 트랙에 대해 고정 길이의 특징 벡터를 학습하도록 설계되어 왔다. 그러나 두 트랙 간 멜로디 유사도를 측정하는 데 중요한 시계적 진행 특성은 고정 길이 벡터로는 충분히 표현되지 않는다. 본 논문에서는 음악 멜로디 유사도 측정을 위한 새로운 시아메스(Siamese) 네트워크 아키텍처를 제안한다. 제안된 아키텍처는 두 가지 구성 요소로 이루어져 있다. 하나는 음악 트랙의 심층 시계열 표현을 학습하는 네트워크이고, 다른 하나는 두 트랙의 심층 시계열로부터 계산된 교차 유사도 행렬을 입력으로 받아 유사도를 추정하는 네트워크이다. 두 네트워크는 공동으로 학습되고 최적화되어 높은 멜로디 유사도 예측 정확도를 달성한다. 다양한 공개 데이터셋을 대상으로 수행된 실험 결과는 제안된 아키텍처의 우수성을 입증한다.