11일 전
KUIELab-MDX-Net: 음악 디믹싱을 위한 이중 스트림 신경망
Minseok Kim, Woosung Choi, Jaehwa Chung, Daewon Lee, Soonyoung Jung

초록
최근 들어 딥러닝 기반의 음악 소스 분리 방법이 다수 제안되고 있다. 최신 기술 중 일부는 많은 층과 많은 스트라이드 연결(skip connection)을 중첩함으로써 SDR 성능을 향상시킬 수 있음을 보여주었다. 이러한 깊고 복잡한 아키텍처는 뛰어난 성능을 보이지만, 일반적으로 학습 및 평가에 막대한 계산 자원과 시간을 요구한다. 본 논문에서는 음악 디믹싱을 위한 이중 스트림 신경망인 KUIELab-MDX-Net을 제안하며, 성능과 자원 요구량 사이에 우수한 균형을 제공한다. 제안된 모델은 시간-주파수 영역 브랜치와 시간 영역 브랜치를 갖추고 있으며, 각각의 브랜치가 독자적으로 스템(stem)을 분리한다. 이후 두 스트림의 결과를 융합하여 최종 추정 결과를 생성한다. KUIELab-MDX-Net은 2021년 ISMIR에서 개최된 음악 디믹싱 챌린지(Music Demixing Challenge)의 리더보드 A에서 2위, 리더보드 B에서 3위를 기록하였다. 본 논문은 또한 MUSDB18이라는 다른 벤치마크에 대한 실험 결과도 종합적으로 정리하였다. 제안된 모델의 소스 코드는 온라인에서 공개되어 있다.