오픈언믹스 - 음악 소스 분리의 참조 구현

음악 소스 분리(music source separation)는 음악을 구성 요소로 분해하는 작업으로, 예를 들어 보컬, 베이스, 드럼 등의 별도의 스템(stem)을 얻는 것을 의미한다. 이러한 분리 기술은 스템을 재편성하거나 재사용하는 데 활용될 수 있으며(리믹스, 리패닝, 업믹싱), 전체 소스를 완전히 추출하는 데도 활용된다(카라오케 제작, 사운드 샘플 생성, 오디오 복원 등). 음악 분리 기술은 오랜 기간에 걸쳐 과학적 연구의 대상이 되어왔으며, 이 문제가 매우 도전적임이 널리 알려져 왔다. 최근에는 딥러닝 기반 시스템이 처음으로 높은 품질의 분리 결과를 도출하면서 상업적 관심도 크게 증가하였다. 그러나 지금까지 상태 최고(STATE-OF-THE-ART) 성능을 달성하는 오픈소스 구현체는 존재하지 않았다.Open-Unmix는 이러한 격차를 메우기 위해 딥 뉴럴 네트워크 기반의 기준 구현체(reference implementation)를 제공한다. 본 시스템은 두 가지 주요 목적을 가지고 있다. 첫째, 학계의 연구를 촉진하기 위해 가장 인기 있는 딥러닝 프레임워크들을 지원하는 구현체를 제공함으로써 연구자들이 실험 결과를 쉽게 재현할 수 있도록 유연한 환경을 제공한다. 둘째, 일반 사용자 및 아티스트가 직접 사용할 수 있도록 사전 훈련된 모델을 공개함으로써 소스 분리 기술의 접근성을 높인다. 또한 Open-Unmix는 음악 분리 분야의 오픈 생태계의 핵심 구성 요소로 설계되었으며, 현재는 오픈 데이터셋, 소프트웨어 유틸리티, 오픈 평가 기준 등을 제공함으로써 재현 가능한 연구(reproducible research)를 촉진하고, 향후 기술 발전의 기반을 마련하고자 한다.