
초록
실세계 녹음 파일에서 음향 이벤트 탐지(SED)를 수행할 때, 종종 목표 음향 이벤트가 겹쳐져 나타나거나 비목표 소음(간섭 소음)이 존재하는 경우가 발생한다. 이러한 문제들은 기존에 주로 분류기 수준에서 해결되어 왔다. 본 연구에서는 음향 이벤트 탐지 전처리로서 음향 분리를 활용하는 새로운 접근 방식을 제안한다. 본 논문에서는 Free Universal Sound Separation 데이터셋과 DCASE 2020 Task 4 음향 이벤트 탐지 베이스라인에서 학습된 음향 분리 모델을 기반으로 하여, 분리된 음향 소스와 원본 혼합 신호를 음향 이벤트 탐지 프레임워크 내에서 어떻게 결합할지에 대한 다양한 방법을 탐구한다. 또한, 음향 분리 모델을 음향 이벤트 탐지 데이터에 맞게 적응시켰을 때, 음향 분리 성능과 음향 이벤트 탐지 성능에 미치는 영향을 함께 조사한다.