17일 전

Sudo rm -rf: 보편적 오디오 소스 분리에 대한 효율적인 네트워크

Efthymios Tzinis, Zhepei Wang, Paris Smaragdis
Sudo rm -rf: 보편적 오디오 소스 분리에 대한 효율적인 네트워크
초록

본 논문에서는 엔드투엔드 일반 목적의 오디오 소스 분리에 효과적인 신경망을 제안한다. 구체적으로, 이 컨볼루션 네트워크의 핵심 구조는 다중 해상도 특징의 연속적인 다운샘플링과 리샘플링을 수행하는 Successive DOwnsampling and Resampling of Multi-Resolution Features(SuDoRMRF)이며, 이들의 집계는 단순한 1차원 컨볼루션을 통해 이루어진다. 이를 통해 제한된 부동소수점 연산 수, 메모리 요구량, 파라미터 수 및 지연 시간으로도 고품질의 오디오 소스 분리를 달성할 수 있다. 음성 및 환경 음향 분리 데이터셋에 대한 실험 결과, SuDoRMRF는 다양한 최신 기술과 비교해 유사하거나 더 우수한 성능을 보였으며, 이는 상당히 높은 계산 자원 요구량을 수반하는 기존 방법들과의 비교에서 두드러진다.

Sudo rm -rf: 보편적 오디오 소스 분리에 대한 효율적인 네트워크 | 최신 연구 논문 | HyperAI초신경