2달 전

ByteCover: 다중 손실 학습을 통한 커버곡 식별

Xingjian Du; Zhesong Yu; Bilei Zhu; Xiaoou Chen; Zejun Ma
ByteCover: 다중 손실 학습을 통한 커버곡 식별
초록

본 논문에서는 커버 송 식별(CSI)을 위한 새로운 특성 학습 방법인 ByteCover를 제시합니다. ByteCover는 고전적인 ResNet 모델을 기반으로 하며, CSI 모델의 성능을 더욱 향상시키기 위해 두 가지 주요 개선 사항이 설계되었습니다. 첫 번째 개선 사항에서는 인스턴스 정규화(IN)와 배치 정규화(BN)의 통합을 도입하여 IBN 블록을 구축하였습니다. 이 IBN 블록은 저희의 ResNet-IBN 모델의 주요 구성 요소입니다. IBN 블록의 도움으로, 저희 CSI 모델은 키, 템포, 팀브레, 장르 등의 음악적 속성 변화에 불변하는 특성을 학습할 수 있으며, 동시에 버전 정보를 유지할 수 있습니다. 두 번째 개선 사항에서는 BNNeck 방법을 사용하여 다중 손실 학습을 가능하게 하고, 분류 손실과 트리플렛 손실을 공동으로 최적화하도록 유도합니다. 이를 통해 커버 송의 클래스 간 차별성과 클래스 내 집약성이 동시에 보장될 수 있습니다. 여러 데이터셋에서 수행된 실험들은 ByteCover의 효과性和效率性을 입증하였으며, Da-TACOS 데이터셋에서 ByteCover는 가장 경쟁력 있는 시스템보다 20.9% 우수한 성능을 보였습니다.注释:在最后一句中,“效果性和效率性”可以翻译为“효과성과 효율성”,以符合韩语的表达习惯。因此,最终翻译如下:본 논문에서는 커버 송 식별(CSI)을 위한 새로운 특성 학습 방법인 ByteCover를 제시합니다. ByteCover는 고전적인 ResNet 모델을 기반으로 하며, CSI 모델의 성능을 더욱 향상시키기 위해 두 가지 주요 개선 사항이 설계되었습니다. 첫 번째 개선 사항에서는 인스턴스 정규화(IN)와 배치 정규화(BN)의 통합을 도입하여 IBN 블록을 구축하였습니다. 이 IBN 블록은 저희의 ResNet-IBN 모델의 주요 구성 요소입니다. IBN 블록의 도움으로, 저희 CSI 모델은 키, 템포, 팀브레, 장르 등의 음악적 속성 변화에 불변하는 특성을 학습할 수 있으며, 동시에 버전 정보를 유지할 수 있습니다. 두 번째 개선 사항에서는 BNNeck 방법을 사용하여 다중 손실 학습을 가능하게 하고, 분류 손실과 트리플렛 손실을 공동으로 최적화하도록 유도합니다. 이를 통해 커버 송의 클래스 간 차별성과 클래스 내 집약성이 동시에 보장될 수 있습니다. 여러 데이터셋에서 수행된 실험들은 ByteCover의 효과성과 효율성을 입증하였으며, Da-TACOS 데이터셋에서 ByteCover는 가장 경쟁력 있는 시스템보다 20.9% 우수한 성능을 보였습니다.

ByteCover: 다중 손실 학습을 통한 커버곡 식별 | 최신 연구 논문 | HyperAI초신경