
초록
소스 분리 모델은 주로 스펙트로그램 또는 웨이브폼 도메인에서 작동한다. 본 연구에서는 각 소스에 가장 적합한 도메인을 모델이 자율적으로 결정하고, 필요 시 두 도메인을 병행하는 엔드투엔드 하이브리드 소스 분리 기법을 제안한다. 제안된 Demucs 아키텍처의 하이브리드 버전은 소니가 주최한 2021년 음악 디믹싱 챌린지에서 우승을 차지했다. 이 아키텍처는 압축된 잔차 브랜치, 로컬 어텐션, 특이값 정규화 등의 추가적인 개선 사항을 포함하고 있다. 전체적으로 MusDB HQ 데이터셋을 기준으로 모든 소스에 대해 신호 대 왜곡비(SDR)가 평균 1.4 dB 향상되었으며, 이 개선 효과는 인간 주관 평가를 통해 확인되었고, 전반적인 품질 점수는 5점 만점에 2.83점(비하이브리드 Demucs는 2.36점)을 기록했다. 또한 오염 없음(Contamination) 측면에서도 3.04점(비하이브리드 Demucs는 2.37점, 대회에서 2위를 차지한 모델은 2.44점)의 높은 점수를 기록하며 우수한 성능을 입증하였다.