8일 전
BYTECOVER2: 효율적인 커버 송 식별을 위한 잠재 임베딩의 차원 축소 방향
{Zejun Ma, Bilei Zhu, Zijie Wang, Ke Chen, Xingjian Du}
초록
컨볼루션 신경망(CNN) 기반 방법은 최근 커버 곡 식별(CSI) 연구에서 주도적인 위치를 차지하고 있다. 대표적인 사례로는 우리가 제안한 ByteCover 시스템이 있으며, 이는 CSI의 주요 데이터셋에서 최고 성능을 기록했다. 본 논문에서는 ByteCover의 업그레이드된 버전인 ByteCover2를 제안한다. ByteCover2는 식별 성능과 효율성 측면에서 기존 ByteCover를 더욱 향상시켰다. ByteCover에 비해 ByteCover2는 추가적인 PCA-FC 모듈을 설계하여 주성분 분석(PCA)과 완전 연결(FC) 신경망의 능력을 통합함으로써 오디오 임베딩의 차원 축소 기능을 강화하였다. 이를 통해 ByteCover2는 보다 정밀하고 효율적인 CSI를 수행할 수 있다. 다양한 차원 크기와 학습 설정에서 여러 데이터셋을 대상으로 ByteCover2를 평가한 결과, ByteCover2는 ByteCover를 포함한 모든 비교 방법들을 상회하였으며, 특히 차원 크기가 128인 경우에서도 기존 ByteCover의 15배 더 작은 차원 크기에도 불구하고 뛰어난 성능을 보였다.