11일 전

SCNet: 음악 소스 분리용 희소 압축 네트워크

Weinan Tong, Jiaxu Zhu, Jun Chen, Shiyin Kang, Tao Jiang, Yang Li, Zhiyong Wu, Helen Meng
SCNet: 음악 소스 분리용 희소 압축 네트워크
초록

딥러닝 기반 방법은 음악 소스 분리 분야에서 중요한 성과를 거두었다. 그러나 초광대역 음악 소스 분리에서 모델 복잡도를 낮은 수준으로 유지하면서 우수한 성능을 달성하는 것은 여전히 도전 과제이다. 기존의 연구들은 주파수 하위대역 간의 차이를 간과하거나, 하위대역 특징을 생성할 때 정보 손실 문제를 충분히 해결하지 못했다. 본 논문에서는 믹스 음원의 스펙트로그램을 여러 하위대역으로 명시적으로 분할하는 새로운 주파수 영역 네트워크인 SCNet을 제안한다. 또한, 다양한 주파수 대역을 모델링하기 위해 희소성 기반 인코더를 도입한다. 정보량이 적은 하위대역에는 더 높은 압축 비율을 적용하여 정보 밀도를 향상시키고, 정보량이 많은 하위대역에 집중하여 모델링한다. 이를 통해 낮은 계산 비용으로도 분리 성능을 크게 향상시킬 수 있다. 실험 결과, 추가 데이터 없이 MUSDB18-HQ 데이터셋에서 제안된 모델이 신호 대 왜곡 비율(SDR) 9.0 dB를 달성하였으며, 기존 최고 수준의 방법들을 초월하였다. 특히, SCNet의 CPU 추론 시간은 이전 최고 수준 모델 중 하나인 HT Demucs의 48%에 불과하다.

SCNet: 음악 소스 분리용 희소 압축 네트워크 | 최신 연구 논문 | HyperAI초신경