16일 전
Spleeter: 사전 훈련된 모델을 갖춘 빠르고 최첨단의 음악 소스 분리 도구
{Manuel Moussallam, Romain Hennequin, Felix Voituret, Anis Khlif}
초록
우리는 사전 훈련된 모델을 활용한 음악 소스 분리에 사용할 수 있는 새로운 도구인 Spleeter를 소개하고 공개합니다. Spleeter는 사용의 용이성, 분리 성능, 속도를 고려하여 설계되었습니다. Spleeter는 TensorFlow [1] 기반으로, 다음과 같은 기능을 제공합니다.• 사전 훈련된 모델을 사용해 단일 명령어로 오디오 파일을 2개, 4개 또는 5개의 소스로 분리할 수 있습니다.• 고립된 소스 데이터셋이 있다면, TensorFlow를 활용해 소스 분리 모델을 훈련하거나 기존 사전 훈련된 모델을 세밀 조정할 수 있습니다. 사전 훈련된 모델의 성능은 공개된 최신 기술 수준과 매우 유사하며, 저자들에 따르면, 일반적인 MusDB18 벤치마크 [6]에서 공개된 모델 중 4개 소스 분리 성능이 가장 뛰어난 모델입니다. 또한 Spleeter는 매우 빠른 속도를 자랑합니다. 사전 훈련된 4소스 모델을 사용할 경우, 단일 그래픽 프로세싱 유닛(GPU)에서 믹스 오디오 파일을 4개의 소스로 분리하는 속도가 실시간 기준으로 100배 빠릅니다. Spleeter는 Docker 패키지로 제공되어 다양한 플랫폼에서 즉시 사용이 가능합니다.