2달 전
ByteCover3: 짧은 쿼리에서 정확한 커버 송 식별
Xingjian Du; Zijie Wang; Xia Liang; Huidong Liang; Bilei Zhu; Zejun Ma

초록
최근 몇 년간 딥 러닝 기반 방법이 커버 송 식별(CSI)의 패러다임으로 자리 잡았으며, ByteCover 시스템은 모든 주요 CSI 데이터셋에서 최고 수준의 성과를 달성하였습니다. 그러나 단편 영상의 급증에 따라, 많은 실제 응용 프로그램들이 데이터베이스 내의 전체 음악 트랙과 짧은 음악 조각을 일치시키는 것이 필요해졌습니다. 이 분야는 아직 충분히 연구되지 않았으며, 산업 수준의 해결책이 필요한 상황입니다. 본 논문에서는 이전 ByteCover 시스템을 로컬 특징을 활용하여 짧은 음악 쿼리의 식별 성능을 더욱 향상시킨 ByteCover3로 업그레이드하였습니다. ByteCover3는 로컬 정렬 손실(LAL) 모듈과 두 단계 특징 검색 파이프라인을 통해 시스템이 CSI를 보다 정확하고 효율적으로 수행할 수 있도록 설계되었습니다. 우리는 다양한 벤치마크 설정 하에서 여러 데이터셋에서 ByteCover3를 평가하였으며, 이 과정에서 ByteCover3는 이전 버전을 포함한 모든 비교 방법들을 능가하는 성능을 보였습니다.